reward-modeling

There are 6 repositories under reward-modeling topic.

sileod/tasksource
Datasets collection and preprocessings framework for NLP extreme multitask learning
Language:Python170 4 910
YangLing0818/IterComp
IterComp: Iterative Composition-Aware Feedback Learning from Model Gallery for Text-to-Image Generation
Language:Python153 3 610
VectorInstitute/vector-inference
Efficient LLM inference on Slurm clusters using vLLM.
Language:Python43 7 18
quanshr/DMoERM
[ACL2024 Findings]DMoERM: Recipes of Mixture-of-Experts for Effective Reward Modeling
Language:Python16 1 00
allenai/hybrid-preferences
Learning to route instances for Human vs AI Feedback
Language:Python15 1 01
MiuLab/DogeRM
The code used in the paper "DogeRM: Equipping Reward Models with Domain Knowledge through Model Merging"
Language:Python4 2 00