xrsrke/instructGOOSE

Implementation of Reinforcement Learning from Human Feedback (RLHF)

Jupyter NotebookMIT

Readme
5Issues
171Stargazers
4Watchers

Watchers

createmomo
drkostas
University of Tennessee, Knoxville
justicelee
OfficiallyMelon
xrsrke
@huggingface

Contact site admin: Geeks.