LLM-Tuning-Safety

Pinned Repositories

LLM-Tuning-Safety.github.io
Language:CSS1 1 03
LLMs-Finetuning-Safety
We jailbreak GPT-3.5 Turbo’s safety guardrails by fine-tuning it on only 10 adversarially designed examples, at a cost of less than $0.20 via OpenAI’s APIs.
Language:Python252 4 829
test.github.io
Language:CSS0 1 00

LLM-Tuning-Safety's Repositories

LLM-Tuning-Safety/LLMs-Finetuning-Safety
We jailbreak GPT-3.5 Turbo’s safety guardrails by fine-tuning it on only 10 adversarially designed examples, at a cost of less than $0.20 via OpenAI’s APIs.
Language:Python252 4 829
LLM-Tuning-Safety/LLM-Tuning-Safety.github.io
Language:CSS1 1 03
LLM-Tuning-Safety/test.github.io
Language:CSS0 1 00