datawhalechina/easy-rl
强化学习中文教程(蘑菇书🍄),在线阅读地址:https://datawhalechina.github.io/easy-rl/
Jupyter NotebookNOASSERTION
Issues
- 2
能否提供代码中主要库的版本
#105 opened - 1
电子书图片标注问题
#104 opened - 0
内存使用超出预期
#103 opened - 1
Tutorial Notebook broken (Colab)
#102 opened - 1
大佬,为啥我总是显示common.utils调用失败啊
#101 opened - 2
dqn的代码错误
#100 opened - 3
在线阅读的地址打不开了
#99 opened - 1
DDPG code error
#98 opened - 1
No common.plot in folder common.
#97 opened - 5
电子版94页和102问题请教
#96 opened - 1
Dueling DQN 实现中的可能错误
#95 opened - 5
伪代码错误
#94 opened - 1
电子版第40页,策略符号是否出错?
#93 opened - 2
68页的代码块缩进错误
#92 opened - 0
离散的SAC代码
#91 opened - 1
QLearning算法可能出现的bug
#90 opened - 1
reinforcement拼写错误
#89 opened - 1
33页中第2章图片错误
#88 opened - 0
/errata
#85 opened - 2
DDPG的代码有很多纰漏
#84 opened - 2
PolicyGradient中的import错误
#83 opened - 1
bug ?
#82 opened - 2
PPO算法训练和验证以及测试过程中action_select疑问
#81 opened - 3
- 1
- 1
用Atari的pong游戏代替CartPole策略网络会发生错误
#76 opened - 2
plot_rewards()函数错误
#75 opened - 1
这个有cnn版本的吗,都是线性模型
#74 opened - 1
PPO的Critic输入加入Action
#73 opened - 1
运行程序会有找不到字体包的错误
#72 opened - 3
DQN代码中有bug
#71 opened - 3
Qlearning error
#70 opened - 3
About SAC
#69 opened - 2
add PPO-continuous code
#68 opened - 1
pdf文件太大,建议压缩。此外建议添加国内的pdf下载方式。
#67 opened - 1
表达过于口语化
#66 opened - 1
question
#65 opened - 2
为什么DQNchoose_action需要消除梯度
#64 opened - 1
Markov Decision Process中的Reward函数
#63 opened - 0
/chapter12/chapter12_questions&keywords
#62 opened - 0
/chapter11/chapter11_questions&keywords
#61 opened - 0
/chapter10/chapter10_questions&keywords
#60 opened - 6
/chapter9/chapter9_questions&keywords
#59 opened - 4
/chapter8/chapter8_questions&keywords
#58 opened - 1
/chapter7/chapter7_questions&keywords
#57 opened - 2
/chapter6/chapter6_questions&keywords
#56 opened - 9
/chapter5/chapter5_questions&keywords
#55 opened - 25
/chapter5/chapter5
#54 opened - 8
/chapter4/chapter4_questions&keywords
#53 opened - 38
/chapter4/chapter4
#52 opened