mrahtz/learning-from-human-preferences

Reproduction of OpenAI and DeepMind's "Deep Reinforcement Learning from Human Preferences"

PythonMIT

Readme
9Issues
301Stargazers
11Watchers

Stargazers

Prev
Next

Contact site admin: Geeks.