deep-tiaotiao
用强化学习来玩微信跳一跳
本工程旨在实现一个端对端的跳一跳AI,直接读取屏幕图像作为输入,通过ADB控制手机完成跳一跳动作。基于强化学习进行训练。
使用与Atari AI相似的Qlearning算法,在训练800步后,成绩大约为100分(持续走大约50步不失败),训练用时约一个小时。使用DDPG算法效果更好一些。
运行环境为windows,python3.6(建议使用Anaconda),主要用到的库为Numpy,Matplotlib,TensorFlow,keras,OpenCV。ADB程序集成与ADB/文件夹中,需要手机打开USB调试,并且电脑有ADB驱动(最新Windows在插入手机后会自动安装)。
结果
QLearning在训练约800次后的效果图
DDPG在训练约800次后不同action对应的critic网络输出