LxzGordon

UCAS PhD student.

University of Chinese Academy of Sciences

Pinned Repositories

Deep-Reinforcement-Learning-with-pytorch
Basic reinforcement learning algorithms. Including:DQN,Double DQN, Dueling DQN, SARSA, REINFORCE, baseline-REINFORCE, Actor-Critic,DDPG,DDPG for discrete action space, A2C, A3C, TD3, SAC, TRPO
Language:Python86 3 017
mbpo_pytorch_offline
MBPO (paper: When to trust your model: Model-based policy optimization) in offline RL settings
Language:Python1 1 00
PECAN
Language:JavaScript11 1 32
pecan_human_AI_coordination
Human-AI coordination experiments on Overcooked
Language:JavaScript8 1 23
TAPE
Language:Python3 1 11
beavertails
BeaverTails is a collection of datasets designed to facilitate research on safety alignment in large language models (LLMs).
Language:Makefile96 5 73

LxzGordon/Deep-Reinforcement-Learning-with-pytorch
Basic reinforcement learning algorithms. Including:DQN,Double DQN, Dueling DQN, SARSA, REINFORCE, baseline-REINFORCE, Actor-Critic,DDPG,DDPG for discrete action space, A2C, A3C, TD3, SAC, TRPO
Language:Python86 3 017
LxzGordon/PECAN
Language:JavaScript11 1 32
LxzGordon/pecan_human_AI_coordination
Human-AI coordination experiments on Overcooked
Language:JavaScript8 1 23
LxzGordon/TAPE
Language:Python3 1 11
LxzGordon/mbpo_pytorch_offline
MBPO (paper: When to trust your model: Model-based policy optimization) in offline RL settings
Language:Python1 1 00