原项目为monokim/PyRacing: A.I. learns how to drive with reinforcement learning,使用DQN算法实现了一个小车在一个简单的赛道上学习驾驶的过程。但原项目及其缓慢,需要大量的episode才能学会驾驶。本项目在原项目的基础上,将DQN算法替换为PPO算法,可以在200个episode内学会驾驶。
原项目为monokim/PyRacing: A.I. learns how to drive with reinforcement learning,使用DQN算法实现了一个小车在一个简单的赛道上学习驾驶的过程。但原项目及其缓慢,需要大量的episode才能学会驾驶。本项目在原项目的基础上,将DQN算法替换为PPO算法,可以在200个episode内学会驾驶。