subaochen/subaochen.github.io

DP学习笔记-使用值迭代解决赌徒问题

Opened this issue · 2 comments

我在0.55时计算出来也是这个,但是如果对V进行随机初始化就不一样了

我在0.55时计算出来也是这个,但是如果对V进行随机初始化就不一样了

谢谢告知!我抽空实验一下。