minyang-chen/RLHF_example

Reinforcement learning from human feedback (RLHF) Movie Reviews Example

Jupyter NotebookApache-2.0

Readme
0Issues
0Stargazers
1Watcher

Watchers

minyang-chen
Ontario, Canada

Contact site admin: Geeks.