pickxiguapi/Uni-RLHF-Platform

Uni-RLHF platform for "Uni-RLHF: Universal Platform and Benchmark Suite for Reinforcement Learning with Diverse Human Feedback" (ICLR2024)

PythonMIT

Readme
0Issues
29Stargazers
2Watchers

Stargazers

ayrnb
clawnotfound
cm090999
cpd0101
Baidu
Crosser-XDU
Xidian University
cybisolated
Tianjin, China
Earthring
Tsinghua University
Fhujinwu
South China University of Technology
hahaguo
Lixiang
hilookas
HuFeiHu
huoliangyu
infinfin
Jasonxu1225
The Chinese University of Hong Kong, Shenzhen
JiangZhaoh
JohannesAck
Tokyo
liovn
makdoudN
Palaiseau, France
nissymori
The University of Tokyo
pickxiguapi
pskun
@IDEA-CCNL
sjYoondeltar
Seoul
superboySB
Beijing Institute of Technology
Taurids
TianhongDai
@ShadowFiendTeam
xingruiyu
University of Technology Sydney
zhanjiqing
zhimin-z
Software Analysis and Intelligence Lab
Zhiyu-h
ziyan-wang98
KCL

Contact site admin: Geeks.