princewen/tensorflow_practice

A3C计算V(St+1)的target_v存在bug

Opened this issue · 0 comments

首先谢谢作者的贡献
v_s_ = r + GAMMA * v_s_ # 使用v(s) = r + v(s+1)计算target_v

v_s_ = r + GAMMA * v_s_ # 使用v(s) = r + v(s+1)计算target_v

这里的v_s_并不是想要的V(St+1),存在bug,请作者核实一下。