princeton-nlp/LLMBar

[ICLR 2024] Evaluating Large Language Models at Evaluating Instruction Following

PythonMIT

Issues

复现对不齐问题
#2 opened 7 months ago by Joe-Hall-Lee
1
Scripts to generate adversarial data
#1 opened a year ago by HuihuiChyan
5