eric-mitchell/direct-preference-optimization

Reference implementation for DPO (Direct Preference Optimization)

PythonApache-2.0

Readme
84Issues
2.3kStargazers
19Watchers

Stargazers

Prev
Next

Contact site admin: Geeks.