Grzego/async-rl

Variation of "Asynchronous Methods for Deep Reinforcement Learning" with multiple processes generating experience for agent (Keras + Theano + OpenAI Gym)[1-step Q-learning, n-step Q-learning, A3C]

PythonMIT

Watchers

adil25
China
Grzego
jhcloos
mdalvi
Mumbai, India
Yvictor
Taiwan
zhuchiheng