junkangwu/Dr_DPO

Towards Robust Alignment of Language Models: Distributionally Robustifying Direct Preference Optimization

Python

Readme
0Issues
8Stargazers
1Watcher

Stargazers

bianbingrui
West Lafayetter, IN, USA
emigmo
Tsinghua University
LazyFyh
BeiJing,China
sbclegend
shaoxiong007
sober-clever
TGLTommy

Contact site admin: Geeks.