A3C计算V(St+1)的target_v存在bug
Opened this issue · 0 comments
wayunderfoot commented
首先谢谢作者的贡献
v_s_ = r + GAMMA * v_s_ # 使用v(s) = r + v(s+1)计算target_v
tensorflow_practice/RL/Basic-A3C-Demo/A3C.py
Line 127 in 6fea88c
这里的v_s_并不是想要的V(St+1),存在bug,请作者核实一下。