facebookresearch/RLCD

Reproduction of "RLCD Reinforcement Learning from Contrast Distillation for Language Model Alignment

PythonMIT

Readme
4Issues
64Stargazers
8Watchers

Watchers

drkostas
University of Tennessee, Knoxville
eemailme
enosair
University Of Chicago
HayeonLee
Meta GenAI
jiaweizzhao
Meta
pariard
yangkevin2
yuandong-tian
Facebook

Contact site admin: Geeks.