lucidrains/self-rewarding-lm-pytorch

Implementation of the training framework proposed in Self-Rewarding Language Model, from MetaAI

PythonMIT

Readme
17Issues
1.3kStargazers
23Watchers

Watchers

AlbertBJ
Beijing, China
AlexiaJM
Samsung SAIT
Ayush-a3h
@Focus-Bear
CamaradaLares
duyvuleo
@oracle
eemailme
hexadecible
Telios
iceychris
Augsburg University of Applied Sciences
jabogithub
jbdatascience
Netherlands
karlotimmerman
@sky-dust-intelligence
lucidrains
San Francisco
madalincostea
MadeNN
mansoor-s
¯\_(ツ)_/¯
mbofb
michael-erasmus
@DonorsChoose
pczzy
Sina.com
physicsru
richstav
runrunliuliu
suchith720
Indian Institute of Technology, Delhi
voxmenthe
vulcangz

Contact site admin: Geeks.