meagmohit/rl-teacher

Code for Deep RL from Human Preferences [Christiano et al]. Plus a webapp for collecting human feedback

PythonMIT

Readme
0Issues
2Stargazers
3Watchers

Stargazers

butterbutterflies
Zhengleee

Contact site admin: Geeks.