由于时间、计算资源有限,本模型没有使用强化学习的方式来学习游戏,而是选择了监督学习
- 使用了sklearn库中的LogisticRegression模型,准确率达到73%
- 游戏最高分大概在180分左右
- 使用了Pytorch深度学习框架,准确率达到87%
- 使用了截图的方式来获取游戏画面,为游戏前期的动作添加延迟
- 游戏最高分为543分
- 利用chrome://dino的环境进行强化学习,在原模型的预训练基础上进行强化学习训练
由于时间、计算资源有限,本模型没有使用强化学习的方式来学习游戏,而是选择了监督学习