StepNeverStop/RLs

Readme
Issues
Stargazers
Watchers

实现新的强化学习算法

StepNeverStop opened this issue 3 years ago · 1 comments

StepNeverStop commented 3 years ago

MARL:
- MADDPG
- MASAC 1346949
- IQL
- VDN
- Q-MIX
- Qatten ad8be31
- MAPPO
- COMA
- QTRAN-alt
- QTRAN-base 4c45ba0
- QPLEX 92d4b9a
SARL:
- Model-free
  - CEM
  - TRPO 67b8979
  - NPG 71115ea
  - FQF
- Model-based:
  - Dreamer b7d88a1
  - MVE 14c9bfc
  - STEVE
  - MBPO
  - PlaNet 7965bcf
  - DreamerV2 7f988d4
- Offline:
  - BC
  - CQL 026ba1d
  - BCQ d60741c
  - AWR
  - BRAC

StepNeverStop commented 3 years ago

优化MARL中的训练部分，避免繁多的键值索引

Topics

sac training-agents reinforcement-learning-algorithm ml-agents unity3d gym pytorch deep-reinforcement-learning reinforcement-learning

Share to

Contact site admin: Geeks.