Flappybird-Pytorch 基于DQN算法的Flappybird项目 进行了有无target网络的DQN算法的对比,有target网络的DQN算法开始收敛的比较慢(因为target网络要每隔一段时间才会进行更新),但是相对于无target网络的DQN算法更稳定。 采用了经验池 训练了一个晚上之后,Flappybird达到可以完美避开障碍物的程度