boyu-ai/Hands-on-RL

3.5公式不准确

Closed this issue · 0 comments

https://hrl.boyuai.com/chapter/1/%E9%A9%AC%E5%B0%94%E5%8F%AF%E5%A4%AB%E5%86%B3%E7%AD%96%E8%BF%87%E7%A8%8B#35-%E8%92%99%E7%89%B9%E5%8D%A1%E6%B4%9B%E6%96%B9%E6%B3%95
在《动手学强化学习》3.5蒙特卡洛方法中,
截屏2023-04-25 23 18 24
上面这里说到是在一个策略下的函数,下面的函数却没有考虑策略。在课件中的公式比较准确:
图片 1
建议修改。