ZubinGou/math-evaluation-harness

A simple toolkit for benchmarking LLMs on mathematical reasoning tasks. 🧮✨

PythonMIT

Readme
4Issues
144Stargazers
2Watchers

Stargazers

2003pro
Hong Kong University of Science and Technology
aiseei
csyanghan
SJTU
GanjinZero
DAMO Academy
Guochry
Renmin University of China
Gxy-2001
Peking University
HillZhang1999
Bytedance
hongtangshui
sjtu & bytedance
HuangOwen
VSDL Lab, HKUST
jmSNU
CML@Seoul National University
jxzhangjhu
Intuit AI Research
koalazf99
Shanghai Jiao Tong University
lewtun
@huggingface
lihaoling
Tsinghua University
lx865712528
@Microsoft Research
lzh0525
MasterVito
Tsinghua University
Olivia-fsm
Ecole Polytech Federal of Lausanne
percent4
Shanghai
peterjc123
Shanghai, China
pprp
Data Science and Analytic Thrust, Information Hub, HKUST(GZ)
qrdai
University of Illinois Urbana-Champaign
REIGN12
Tsinghua University
seshurajup
@dolcera
SinclairCoder
China
SivilTaram
Researcher @ TikTok
TechxGenus
USTC
TianheWu
Tsinghua University
ToheartZhang
Renmin Univiersity of China
valeriocardoso
Hvar Consulting
wwh0411
Xinzhe-Ni
xz259
yiyihum
yulonghui
Peking University
ZubinGou
Tsinghua University

Prev
Next

Contact site admin: Geeks.