Waneila

Pinned Repositories

CMMLU
CMMLU: Measuring massive multitask language understanding in Chinese
Language:Python703 11 3757
ceval
Official github repo for C-Eval, a Chinese evaluation suite for foundation models [NeurIPS 2023]
Language:Python1.6k 15 8378
BCEmbedding
Netease Youdao's open-source embedding and reranker models for RAG products.
Language:Python1.5k 8 8799
MathBench
[ACL 2024 Findings] MathBench: A Comprehensive Multi-Level Difficulty Mathematics Evaluation Dataset
84 2 131
MixEval
The official evaluation suite and dynamic data release for MixEval.
Language:Python224 1 3435
CMMLU
CMMLU: Measuring massive multitask language understanding in Chinese
Language:Python00
randomk
0 1 00
test
01
ZeroEval
A simple unified framework for evaluating LLMs
Language:HTML00
ZeroEval
A simple unified framework for evaluating LLMs
Language:HTML146 1 920

Waneila's Repositories

Waneila/CMMLU
CMMLU: Measuring massive multitask language understanding in Chinese
Language:Python00
Waneila/randomk
0 1 00
Waneila/test
01
Waneila/ZeroEval
A simple unified framework for evaluating LLMs
Language:HTML00