ZeroYuHuang

EdinburghNLP

Pinned Repositories

rlfh-gen-div
This is code for most of the experiments in the paper Understanding the Effects of RLHF on LLM Generalisation and Diversity
Language:Python39 3 36
trl
Train transformer language models with reinforcement learning.
Language:Python10.5k 77 1.3k1.4k
alpaca_eval
An automatic evaluator for instruction-following language models. Human-validated, high-quality, cheap, and fast.
Language:Jupyter Notebook1.6k 8 155248
Awesome-Mixture-of-Experts-Papers
A curated reading list of research in Mixture-of-Experts(MoE).
0 0 00
kNeuron-Tuning
Language:Jupyter Notebook0 1 00
Reward-Calibration
Language:Jupyter Notebook60
TRAMA
Source code for TALLIP paper Token Relation Aware Chinese Named Entity Recognition
Language:Python0 0 00
Transformer-Patcher
Language:Python28 1 93
ZeroYuHuang.github.io
Language:HTML0 1 00
RMB-Reward-Model-Benchmark
Language:Python171

ZeroYuHuang's Repositories

ZeroYuHuang/Transformer-Patcher
Language:Python28 1 93
ZeroYuHuang/Reward-Calibration
Language:Jupyter Notebook60
ZeroYuHuang/Awesome-Mixture-of-Experts-Papers
A curated reading list of research in Mixture-of-Experts(MoE).
0 0 00
ZeroYuHuang/kNeuron-Tuning
Language:Jupyter Notebook0 1 00
ZeroYuHuang/TRAMA
Source code for TALLIP paper Token Relation Aware Chinese Named Entity Recognition
Language:Python0 0 00
ZeroYuHuang/ZeroYuHuang.github.io
Language:HTML0 1 00