sanmuyang

sanmuyang's Stars

thu-ml/tianshou
An elegant PyTorch deep reinforcement learning library.
Language:Python8k 93 7461.1k
PaddlePaddle/PARL
A high-performance distributed training framework for Reinforcement Learning
Language:Python3.3k 62 517818
LyWangPX/Reinforcement-Learning-2nd-Edition-by-Sutton-Exercise-Solutions
Solutions of Reinforcement Learning, An Introduction
Language:Jupyter Notebook2k 35 85465
oxwhirl/pymarl
Python Multi-Agent Reinforcement Learning framework
Language:Python1.9k 30 130387
PKU-Alignment/safe-rlhf
Safe RLHF: Constrained Value Alignment via Safe Reinforcement Learning from Human Feedback
Language:Python1.4k 18 85120
oxwhirl/smac
SMAC: The StarCraft Multi-Agent Challenge
Language:Python1.1k 21 87230
tinkoff-ai/CORL
High-quality single-file implementations of SOTA Offline and Offline-to-Online RL algorithms: AWAC, BC, CQL, DT, EDAC, IQL, SAC-N, TD3+BC, LB-SAC, SPOT, Cal-QL, ReBRAC
Language:Python1.1k 16 28131
hanjuku-kaso/awesome-offline-rl
An index of algorithms for offline reinforcement learning (offline-rl)
933 45 187
NtrQQ/download
752 36 4279
hijkzzz/pymarl2
Fine-tuned MARL algorithms on SMAC (100% win rates on most scenarios)
Language:Python632 17 40124
sanmuyang/multi-agent-PPO-on-SMAC
Implementations of MAPPO and IPPO on SMAC, the multi-agent StarCraft environment.
Language:Python58 2 25
Facebear-ljx/DOGE
The official implementation of "When Data Geometry Meets Deep Function: Generalizing Offline Reinforcement Learning" (ICLR2023)
Language:Python43 1 02
ryanxhr/DWBC
[ICML 2022] The official implementation of DWBC in "Discriminator-Weighted Offline Imitation Learning from Suboptimal Demonstrations"
Language:Python34 1 12