/rl-tutorials

basic algorithms of reinforcement learning

Primary LanguageJupyter NotebookMIT LicenseMIT

0. 写在前面

本项目用于学习RL基础算法,主要面向对象为RL初学者、需要结合RL的非专业学习者,尽量做到: 注释详细结构清晰

注意本项目为实战内容,建议首先掌握相关算法的一些理论基础,再来享用本项目,理论教程参考本人参与编写的蘑菇书

未来开发计划包括但不限于:多智能体算法、强化学习Python包以及强化学习图形化编程平台等等。

1. 项目说明

本项目内容主要包含以下几个子项目,每个子项目下都有对应的README描述:

2. 算法环境

算法环境说明请跳转env

3. 算法列表

注:点击对应的名称会跳到codes下对应的算法中,其他版本还请读者自行翻阅

算法名称 参考文献 作者 备注
Policy Gradient Policy Gradient paper johnjim0816
Monte Carlo johnjim0816
DQN DQN Paper johnjim0816
DQN-CNN 待更
DoubleDQN Double DQN Paper johnjim0816
DuelingDQN DuelingDQN Paper johnjim0816
PER_DQN PER DQN Paper wangzhongren
NoisyDQN Noisy DQN Paper johnjim0816
SoftQ Soft Q-learning paper johnjim0816
SAC SAC paper
SAC-Discrete SAC-Discrete paper
SAC-S SAC-S paper
DSAC DSAC paper 待更

4. 友情说明

推荐使用VS Code做项目,入门可参考VSCode上手指南