Flappybird-Pytorch

基于DQN算法的Flappybird项目

进行了有无target网络的DQN算法的对比，有target网络的DQN算法开始收敛的比较慢(因为target网络要每隔一段时间才会进行更新)，但是相对于无target网络的DQN算法更稳定。
采用了经验池
训练了一个晚上之后，Flappybird达到可以完美避开障碍物的程度

LinYuOu/Flappybird-Pytorch