CLUE benchmark

Organization of Language Understanding Evaluation benchmark for Chinese: tasks & datasets, baselines, pre-trained Chinese models, corpus and leaderboard

Pinned Repositories

CLUE
中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard
Language:Python3.9k 89 99541
CLUECorpus2020
Large-scale Pre-training Corpus for Chinese 100G 中文预训练语料
891 21 1280
CLUEDatasetSearch
搜索所有中文NLP数据集，附常用英文NLP数据集
Language:Python4k 61 12596
CLUENER2020
CLUENER2020 中文细粒度命名实体识别 Fine Grained Named Entity Recognition
Language:Python1.4k 20 92299
CLUEPretrainedModels
高质量中文预训练模型集合：最先进大模型、最快小模型、相似度专门模型
Language:Python794 19 1796
SuperCLUE
SuperCLUE: 中文通用大模型综合性基准 | A Benchmark for Foundation Models in Chinese
2.7k 35 4691
SuperCLUE-Agent
SuperCLUE-Agent: 基于中文原生任务的Agent智能体核心能力测评基准
74 4 82
SuperCLUE-Auto
汽车行业中文大模型测评基准，基于多轮开放式问题的细粒度评测
20 2 31
SuperCLUE-RAG
中文原生检索增强生成测评基准
69 3 23
SuperCLUE-Safety
SC-Safety: 中文大模型多轮对抗安全基准
81 3 94

CLUE benchmark's Repositories

CLUEbenchmark/CLUEDatasetSearch
搜索所有中文NLP数据集，附常用英文NLP数据集
Language:Python4k 61 12596
CLUEbenchmark/CLUE
中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard
Language:Python3.9k 89 99541
CLUEbenchmark/SuperCLUE
SuperCLUE: 中文通用大模型综合性基准 | A Benchmark for Foundation Models in Chinese
2.7k 35 4691
CLUEbenchmark/CLUENER2020
CLUENER2020 中文细粒度命名实体识别 Fine Grained Named Entity Recognition
Language:Python1.4k 20 92299
CLUEbenchmark/CLUECorpus2020
Large-scale Pre-training Corpus for Chinese 100G 中文预训练语料
891 21 1280
CLUEbenchmark/FewCLUE
FewCLUE 小样本学习测评基准，中文版
Language:Python484 13 1472
CLUEbenchmark/pCLUE
pCLUE: 1000000+多任务提示学习数据集
Language:Jupyter Notebook452 7 951
CLUEbenchmark/SimCLUE
3000000+语义理解与匹配数据集。可用于无监督对比学习、半监督学习等构建中文领域效果最好的预训练模型
Language:Python258 4 232
CLUEbenchmark/SuperCLUElyb
SuperCLUE琅琊榜：中文通用大模型匿名对战评价基准
140 5 75
CLUEbenchmark/PyCLUE
Python toolkit for Chinese Language Understanding(CLUE) Evaluation benchmark
Language:Python128 9 514
CLUEbenchmark/SuperCLUE-Llama2-Chinese
Llama2开源模型中文版-全方位测评，基于SuperCLUE的OPEN基准 | Llama2 Chinese evaluation with SuperCLUE
125 2 27
CLUEbenchmark/SuperCLUE-Safety
SC-Safety: 中文大模型多轮对抗安全基准
81 3 94
CLUEbenchmark/SuperCLUE-Agent
SuperCLUE-Agent: 基于中文原生任务的Agent智能体核心能力测评基准
74 4 82
CLUEbenchmark/SuperCLUE-Open
中文通用大模型开放域多轮测评基准 | An Open Domain Benchmark for Foundation Models in Chinese
71 3 23
CLUEbenchmark/SuperCLUE-RAG
中文原生检索增强生成测评基准
69 3 23
CLUEbenchmark/MobileQA
离线端阅读理解应用 QA for mobile, Android & iPhone
Language:Python60 12 213
CLUEbenchmark/modelfun
一站式自动化开源标注平台
Language:Java56 3 313
CLUEbenchmark/SuperCLUE-Math6
SuperCLUE-Math6：新一代中文原生多轮多步数学推理数据集的探索之旅
Language:Python31 2 13
CLUEbenchmark/SuperCLUE-Auto
汽车行业中文大模型测评基准，基于多轮开放式问题的细粒度评测
20 2 31
CLUEbenchmark/LGEB
LGEB: Benchmark of Language Generation Evaluation
Language:Python16 4 11
CLUEbenchmark/SuperCLUE-Llama3-Chinese
Llama3开源模型中文版-全方位测评，基于SuperCLUE基准 | Llama3 Chinese Evaluation with SuperCLUE
16 4 1
CLUEbenchmark/SuperCLUE-Video
中文原生多层次文生视频测评基准
13 2 01
CLUEbenchmark/SuperCLUEgkzw
SuperCLUE高考作文机器自动阅卷系统
13 2 2
CLUEbenchmark/SuperCLUE-Role
SuperCLUE-Role中文原生角色扮演测评基准
11 3 2
CLUEbenchmark/SuperCLUE-Industry
中文原生工业测评基准
10 3 1
CLUEbenchmark/SuperCLUE-Code3
中文原生等级化代码能力测试基准
9 2 31
CLUEbenchmark/SuperCLUE-Fin
中文金融大模型测评基准，六大类二十五任务、等级化评价，国内模型获得A级
6
CLUEbenchmark/SuperCLUE-Image
中文原生文生图测评基准
6
CLUEbenchmark/SuperCLUE-ICabin
汽车智能座舱大模型测评基准
5
CLUEbenchmark/SuperCLUE-Long
中文原生长文本测评基准
5