yypkudo opened this issue 5 years ago · 0 comments
您代码中的epsilon似乎只在建网络的时候加了,每次训练结束都没有抽样新的扰动,这是不是跟原文算法并不相符?