thu-coai/Safety-Prompts

Chinese safety prompts for evaluating and improving the safety of LLMs. 中文安全prompts，用于评估和提升大模型的安全性。

Apache-2.0

Issues

instruction_attack_scenarios.json里包含关于**的不当数据
#22 opened 4 months ago by wusi1590
1
自动化评估方法有哪些？
#9 opened a year ago by potong
2
数据集的回复部分有用专门的安全相关prompt吗？
#21 opened 6 months ago by IcyFeather233
1
What model is the LLM used in Figure 3？
#20 opened 6 months ago by XiaoluJiayou
1
Why the sensitive topics are missing?
#17 opened 9 months ago by HuangHaoyu1997
3
Is there any downloadable evaluation table shown in the leaderboards?
#19 opened 9 months ago by zhimin-z
3
请问访问评测平台一定要清华内网吗？
#18 opened 9 months ago by Ligandlly
3
Missing models?
#16 opened 10 months ago by zhimin-z
1
Why test leaderboard only have half of the models of dev leaderboard?
#15 opened 10 months ago by zhimin-z
2
请问这里提供的数据和safetyBench中用于测试的数据是同一份吗？
#14 opened a year ago by WinncyNing
1
多项选择题的安全评测数据集哪里可以下载？
#13 opened a year ago by gongjunjin
1
多项选择题的安全评测数据集哪里可以下载？
#12 opened a year ago by gongjunjin
0
数据集包含标准答案吗
#11 opened a year ago by demi543
1
在平台上提交了公开数据集的评测结果，但是一直没出结果。
#8 opened a year ago by fengyh3
1
公开测试集下载
#7 opened a year ago by Hearmen
1
这些数据是正确的吗？
#5 opened a year ago by guozhiyao
1
无法进入安全评测平台
#6 opened a year ago by WenjingBao
1
请问不同场景下评测时使用的prompt后续会开源吗
#4 opened a year ago by lierer007
1
请教下：评测判断时用instructGPT+prompt和用这些数据finetune分类模型，哪个评测的相关性更高，有对比数据不
#2 opened a year ago by lierer007
5
模型增广方法是否会开源
#1 opened a year ago by hutbery
3
手工标注的prompt
#3 opened a year ago by zhuang-li
2