open-compass/CriticBench

[NeurIPS 2024] A comprehensive benchmark for evaluating critique ability of LLMs

PythonApache-2.0

Readme
0Issues
27Stargazers
3Watchers

Stargazers

chenxu05037
Echo-minn
OpenMMLab
Erwin-X
evdcush
Ezra-Yu
shanghai
gmftbyGMFTBY
Beijing Institute of Technology
jbwang1997
NWPU -> NKU
JeffCarpenter
Canada
Kunlun-Zhu
Mila-Quebec AI Institute; UdeM
MatCaviar
TONGJI UNIVERSITY
Meteor-xx
Beijing,China
monmonli
University of Michigan, Ann Arbor
SeungoneKim
Carnegie Mellon University
shyram
Samsung Research HQ
vivian1928
xnzac
UK
zehuichen123
USTC
ZhaoQiiii
Shanghai AI Lab
zhimin-z
Software Analysis and Intelligence Lab
zwvc
ZwwWayne
MMLab, NTU

Contact site admin: Geeks.