AgentBase.py中std的计算是否有问题
Opened this issue · 2 comments
ljn114514 commented
第235行部分self.cri.state_std[:] = self.cri.state_std,这样的话cri.state_std是永远不变的
Yonv1943 commented
谢谢你的提醒,我们检查了相关函数,的确发现问题,如下:
在函数 def update_avg_std_for_normalization
里,我们更新了 state_std
:
ElegantRL/elegantrl/agents/AgentBase.py
Lines 230 to 240 in bf5ecff
应该改成
self.cri.state_avg[:] = self.act.state_avg
self.cri.state_std[:] = self.act.state_std # 这里应该做出修改