YJWon99

Pinned Repositories

HALOs
A library with extensible implementations of DPO, KTO, PPO, ORPO, and other human-aware loss functions (HALOs).
Language:Python769 8 2447
red-instruct
Codes and datasets of the paper Red-Teaming Large Language Models using Chain of Utterances for Safety-Alignment
Language:Python87 1 912
direct-preference-optimization
Reference implementation for DPO (Direct Preference Optimization)
Language:Python2.3k 19 84189
alpaca_eval
An automatic evaluator for instruction-following language models. Human-validated, high-quality, cheap, and fast.
Language:Jupyter Notebook1.6k 8 152247
DDPPyTorchLightningPruningCallback
Support TorchDistributedTrial in PyTorchLightningPruningCallback from Optuna
Language:Python0 1 00
DeepSpeed
DeepSpeed is a deep learning optimization library that makes distributed training and inference easy, efficient, and effective.
Language:Python0 0 00
optuna
A hyperparameter optimization framework
Language:Python0 0 00
trl
Train transformer language models with reinforcement learning.
Language:Python0 0 00

YJWon99's Repositories

YJWon99/DDPPyTorchLightningPruningCallback
Support TorchDistributedTrial in PyTorchLightningPruningCallback from Optuna
Language:Python0 1 00
YJWon99/DeepSpeed
DeepSpeed is a deep learning optimization library that makes distributed training and inference easy, efficient, and effective.
Language:Python0 0 00
YJWon99/optuna
A hyperparameter optimization framework
Language:Python0 0 00
YJWon99/trl
Train transformer language models with reinforcement learning.
Language:Python0 0 00