jjkke88/trpo

trust region policy optimization base on gym and tensorflow, can run in distribution mode

Python

Readme
1Issue
15Stargazers
1Watcher

Stargazers

AirSmithX
AnujaNagare
Georgia
chingyaoc
Meta
doubling
United States
Ivehui
luxiangnk
MarcelZuur
Neo-X
Canada
RexDrac
shareeff
tangzk
WarSmoke
wellbeing18
zongyaojin

Contact site admin: Geeks.