Maxpridy/trpo

Trust Region Policy Optimization with TensorFlow and OpenAI Gym

Jupyter NotebookMIT

Readme
0Issues
0Stargazers
3Watchers

Watchers

jhcloos
Maxpridy
@netmarble
paper2code-bot
@paper2code

Contact site admin: Geeks.