richhh520

Zhejiang University

Pinned Repositories

DecodingTrust
A Comprehensive Assessment of Trustworthiness in GPT Models
Language:Python260 6 2256
fastRAG
Efficient Retrieval Augmentation and Generation Framework
Language:Python1.3k 12 33124
machine_unlearning
Existing Literature about Machine Unlearning
785 26 596
Awesome_Bias_and_Fairness_Datasets_and_Benchmarks
Awesome Bias and Fairness Datasets and Benchmarks in Language Models
4 1 00
Learnable-Privacy-Neurons-Localization
ACL 2024 Learnable Privacy Neurons Localization in Language Models
10 1 10
PAD
00
ruizhe.github.io
Language:JavaScript00
RLHF-Reward-Modeling
Recipes to train reward model for RLHF.
Language:Python898 20 3171
awesome-machine-unlearning
Awesome Machine Unlearning (A Survey of Machine Unlearning)
Language:Jupyter Notebook734 13 4751
awesome-fairness-papers
Papers on fairness in NLP
431 31 452