princewen/tensorflow_practice

请教一个noisy-net dqn的问题

yypkudo opened this issue · 0 comments

您代码中的epsilon似乎只在建网络的时候加了,每次训练结束都没有抽样新的扰动,这是不是跟原文算法并不相符?