natolambert/rlhf-book

Textbook on reinforcement learning from human feedback

TeXMIT

Readme
6Issues
87Stargazers
3Watchers

Stargazers

Prev
Next

Contact site admin: Geeks.