IAAR-Shanghai/UHGEval
[ACL 2024] User-friendly evaluation framework: Eval Suite & Benchmarks: UHGEval, HaluEval, HalluQA, etc.
PythonApache-2.0
Issues
- 1
请问这个能检测幻觉吗?还是幻觉评估?我能加入我的数据集让他判断每一个回答是否是幻觉呢?
#29 opened by zjj100-zjj - 1
请问快速开始运行了demo得到的结果是什么呢?
#28 opened by zjj100-zjj - 13
LLM的url具体是什么呢,以Qwen为例可以举一个例子吗
#6 opened by promisecc - 2
Welcome to join opencompass
#8 opened by tonysy