/Flappybird-Pytorch

基于DQN算法的Flappybird项目

Primary LanguagePython

Flappybird-Pytorch

基于DQN算法的Flappybird项目

  • 进行了有无target网络的DQN算法的对比,有target网络的DQN算法开始收敛的比较慢(因为target网络要每隔一段时间才会进行更新),但是相对于无target网络的DQN算法更稳定。
  • 采用了经验池
  • 训练了一个晚上之后,Flappybird达到可以完美避开障碍物的程度