mtbench101/mt-bench-101

[ACL 2024] MT-Bench-101: A Fine-Grained Benchmark for Evaluating Large Language Models in Multi-Turn Dialogues

Apache-2.0

Readme
5Issues
36Stargazers
6Watchers

Stargazers

apache2046
bittersweet1999
bryanyzhu
Amazon AI
dongguanting
Renmin University of China
doublejingz
huiwy
liujiaheng
Beihang University (BUAA)
liuyaox
lmc8133
Beijing University of Posts and Telecommunications
mtbench101
penglin03
sefira
Alibaba
shyram
Samsung Research HQ
tiezhuguangtailang
victorjiax
warpmatrix
Sun Yat-sen University
wwn1233
yifan123
The Chinese University of Hong Kong
zemerov
Moscow, Russia
ZhuochengZhang98
University of Chinese Academy of Sciences

Contact site admin: Geeks.