RLHFlow/RLHF-Reward-Modeling

Recipes to train reward model for RLHF.

PythonApache-2.0

Readme
25Issues
582Stargazers
19Watchers

Stargazers

Prev
Next

Contact site admin: Geeks.