Geeks

jordan-schneider/baby-rlhf

Simple conceptual implementation of reinforcement learning from human preferences.

Python

Readme
0Issues
1Stargazer
1Watcher

Stargazers

Kunlun-Zhu

Contact site admin: Geeks.