MLGroupJLU/LLM-eval-survey

The official GitHub page for the survey paper "A Survey on Evaluation of Large Language Models".

Issues

Paper Title Change
#29 opened 2 months ago by nlee-208
0
The leaderboard website is down...
#30 opened 8 months ago by zhimin-z
0
Can you add SpyGame to your survey?
#26 opened 4 months ago by Skytliang
1
Is all the evaluation of LLM done by changeing the prompts?
#28 opened 10 months ago by PlantPotatoOnMoon
0
Can you add our recent work to your survey?
#25 opened a year ago by grayground
1
Add CMB to your paper
#22 opened a year ago by g-h-chen
4
咨询下，LLM的数据污染检测（判断数据集是否训练见过）技术方向靠谱吗？有推荐论文吗？
#21 opened a year ago by gongjunjin
1
Can you add LRV-Instruction to Your update Arxiv Version?
#23 opened a year ago by FuxiaoLiu
1
Add Llama 2 as model evaluated?
#15 opened a year ago by tiansiyuan
3
Suggestion for adding OpenCompass to survey
#11 opened a year ago by gaotongxiao
2
An idea AGI evaluation -> An ideal AGI evaluation
#16 opened a year ago by tiansiyuan
1
请教下，通过评测反馈LLM模型优化有哪些方向可以研究吗？即评测能反馈LLM优化建议
#20 opened a year ago by gongjunjin
1
but it still lack the ability to perform Eng → X translation
#17 opened a year ago by tiansiyuan
1
Add paper, ALIGNING AI WITH SHARED HUMAN VALUES
#18 opened a year ago by tiansiyuan
1
ARB Benchmark
#10 opened a year ago by kennethleungty
2
Suggestion about adding one evaluation paper about LLMs in science
#9 opened a year ago by taichengguo
2
Add a new paper.
#3 opened a year ago by Wangpeiyi9979
1