Vance0124/Token-level-Direct-Preference-Optimization

Reference implementation for Token-level Direct Preference Optimization(TDPO)

PythonApache-2.0

Readme
7Issues
122Stargazers
1Watcher

Stargazers

Prev
Next

Contact site admin: Geeks.