sisl/ASTPrompter

Weakly Supervised Automated Language Model Red-Teaming to Identify Likely Toxic Prompts.

Python

Readme
0Issues
2Stargazers
9Watchers

Stargazers

mossr
Stanford Intelligent Systems Laboratory
TheEnquirer

Contact site admin: Geeks.