wangshusen/DRL

Deep Reinforcement Learning

NOASSERTION

Issues

熵定义的符号
#55 opened 3 months ago by kubefay
0
发现了两个小错误
#54 opened a year ago by blq001
0
有没有代码示例呢？
#37 opened 3 years ago by 2017040264
3
经验回放
#53 opened 2 years ago by shuzi
1
3.4.1节动作价值函数
#52 opened 2 years ago by TronYY
0
p101 题3答案B文字错误
#46 opened 2 years ago by itlogger
3
REINFORCE with Baseline 中的 slides 出现错误
#51 opened 2 years ago by jzhangCSER01
0
请问如何cite这本书呢？
#39 opened 2 years ago by yyanhan
3
关于s,S与a,A间的相互转化
#50 opened 2 years ago by Clayfigure
0
强化学习视频中使用的讲义和该 repo 中的 slides 对不上
#49 opened 2 years ago by Whisht
0
跪求老师更新一节PPO的讲解视频
#27 opened 3 years ago by yanhongjin228228
3
7.3.2证明中的typo
#48 opened 2 years ago by yuechuhaoxi020609
2
10.3.3 小节漏字
#47 opened 2 years ago by aishangcengloua
0
7.3.2 节可能的错误
#45 opened 2 years ago by aishangcengloua
1
第五章SARSA算法描述是否有误
#44 opened 2 years ago by txsniper
3
我不清楚这里是否写错了
#41 opened 2 years ago by Oliver-F1
4
劝你识相点，给我入驻B站（手动狗头）
#43 opened 2 years ago by Oliver-F1
1
github上的DRL.pdf是最新版本吗？
#42 opened 2 years ago by ShuhuaGao
0
Typo in Notes_CN/DRL.pdf: regarding entropy formulae
#40 opened 2 years ago by wyzh98
0
建议增加PPO和SAC讲解
#38 opened 3 years ago by TimHo0331
1
4.2.1 一术语使用不妥
#19 opened 3 years ago by AtomicVar
2
第7章视频没有公开
#26 opened 3 years ago by yiyayiyau
1
请教，对于多Agent，按既定次序采取动作，而不是同时采取动作的问题，应如何建模，是否有推荐的论文？多谢
#22 opened 3 years ago by BradleyNing
1
感谢王先生难能可贵的分享，能否给书籍增加书签目录？
#36 opened 3 years ago by rocke2020
2
第9章笔误及第6章疑问
#29 opened 3 years ago by DeepGeGe
0
Nothing
#35 opened 3 years ago by 2017040264
0
6.2.4 使用目标网络：可能的错误
#34 opened 3 years ago by 2017040264
2
可能的错误：6.2.1小节--自举导致偏差的传播
#32 opened 3 years ago by 2017040264
2
8.1节可能的小错误
#33 opened 3 years ago by KID0031
1
7. Multi-Agent Reinforcement Learning. 视频看不了
#31 opened 3 years ago by enjoysport2022
1
对前两章基础部分内容的读后反馈
#15 opened 3 years ago by hydt
6
习题答案
#30 opened 3 years ago by long246
0
前9章读后感
#28 opened 3 years ago by LeeChunley
0
Double DQN gamma 参数
#25 opened 3 years ago by Code-Notebook
0
3.5 添加相关概念
#23 opened 3 years ago by Code-Notebook
0
4.4 Q 学习算法 P47 落下一个字
#24 opened 3 years ago by Code-Notebook
1
很不错的书，希望增加目录，还有文中公式，引用的超链接
#12 opened 4 years ago by kli-casia
2
基于强化学习的知识图谱推理
#21 opened 3 years ago by Joyrocky
0
建议增加值分布强化学习的内容
#20 opened 3 years ago by lsyysl9711
0
阅读反馈
#18 opened 3 years ago by musicaudience
2
ImageNet 在深度学习中的应用
#17 opened 3 years ago by Benjizhang
1
More explanations on why Dueling DQN separates Q function
#16 opened 3 years ago by Renovamen
1
确定策略梯度章节的改进建议
#14 opened 3 years ago by kli-casia
2
TRPO中的一个小问题
#13 opened 3 years ago by kli-casia
6
4.3.1算法推导的第一个公式
#8 opened 4 years ago by wangchuan
3
一个小typo
#11 opened 4 years ago by kli-casia
1
Missing right parenthesis in Appendix A
#10 opened 4 years ago by Renovamen
1
41页的参数更新
#9 opened 4 years ago by skychan
2
Question About P48
#7 opened 4 years ago by xiaobanni
5
第四页有一处错字
#6 opened 4 years ago by hydelovegood
3