AIFlames

Pinned Repositories

Flames
Flames is a highly adversarial benchmark in Chinese for LLM's harmlessness evaluation developed by Shanghai AI Lab and Fudan NLP Group.
330
MLLMGuard
Language:Python162
Fake-Alignment
Language:Python50
ESC-Eval
[EMNLP 2024] ”ESC-Eval: Evaluating Emotion Support Conversations in Large Language Models“
Language:Python50
Reflection-Bench
probing AI intelligence with reflection
Language:Python30

AIFlames doesn’t have any repository yet.