princeton-nlp/SimPO

[NeurIPS 2024] SimPO: Simple Preference Optimization with a Reference-Free Reward

PythonMIT

Readme
74Issues
770Stargazers
8Watchers

Watchers

danqi
Princeton University
drkostas
University of Tennessee, Knoxville
lin72h
michalwols
New York
ozf
Software Square, Byte Town, Logicstate, Computronia
remusao
Munich
xiamengzhou
Princeton University
yumeng5
UVA

Contact site admin: Geeks.