andy-yangz/Awesome-RLHF

Awesome Reinforcement Learning from Human Feedback, the secret behind ChatGPT XD

MIT

Readme
0Issues
22Stargazers
2Watchers

Watchers

andy-yangz
Tencent
drkostas
University of Tennessee, Knoxville

Contact site admin: Geeks.