TrueNobility303

PhD student, IIIS, Tsinghua University

Tsinghua UniversityBeijing

TrueNobility303's Stars

yaircarmon/recapp
RECAPP: Crafting a More Efficient Catalyst for Convex Optimization
Language:Jupyter Notebook2
Ledzy/BAdam
Language:Python19412
hiyouga/LLaMA-Factory
Efficiently Fine-Tune 100+ LLMs in WebUI (ACL 2024)
Language:Python31.8k3.9k
gsmalinovsky/ProxSkip-Public
Camera ready version
Language:Jupyter Notebook32
alshedivat/al-folio
A beautiful, simple, clean, and responsive Jekyll theme for academics
Language:HTML10.7k11k
x-zho14/MAPLE
Code for Model Agnostic Sample Reweighting for Out-of-Distribution Learning
Language:Python411
Raymond30/CG-BiO
Language:MATLAB3
danielle-hausler/ms-optimal
Language:Python2
tatsu-lab/stanford_alpaca
Code and documentation to train Stanford's Alpaca models, and generate the data.
Language:Python29.4k4k
sowmaster/esjacobians
Implementations of the algorithms described in the paper: On the Convergence Theory for Hessian-Free Bilevel Algorithms.
Language:Jupyter Notebook102
2003pro/ScaleBiO
This is the official implementation of ScaleBiO: Scalable Bilevel Optimization for LLM Data Reweighting
Language:Python112
phquang/Contextual-Transformation-Network
Language:Python214
Chavdarova/LAGAN-Lookahead_Minimax
Source code for "Taming GANs with Lookahead–Minmax", ICLR 2021.
Language:Jupyter Notebook156
bojone/rerope
Rectified Rotary Position Embeddings
Language:Python33229
bojone/NBCE
Naive Bayes-based Context Extension
Language:Python31122
LIONS-EPFL/BiSAM
The public code for BiSAM paper.
Language:Python2
ZhuiyiTechnology/roformer
Rotary Transformer
Language:Python78948
yang-song/score_sde
Official code for Score-Based Generative Modeling through Stochastic Differential Equations (ICLR 2021, Oral)
Language:Jupyter Notebook1.4k198
yang-song/score_sde_pytorch
PyTorch implementation for Score-Based Generative Modeling through Stochastic Differential Equations (ICLR 2021, Oral)
Language:Jupyter Notebook1.7k309
OPTML-Group/DeepZero
[ICLR'24] "DeepZero: Scaling up Zeroth-Order Optimization for Deep Model Training" by Aochuan Chen*, Yimeng Zhang*, Jinghan Jia, James Diffenderfer, Jiancheng Liu, Konstantinos Parasyris, Yihua Zhang, Zheng Zhang, Bhavya Kailkhura, Sijia Liu
Language:Python374
weizeming/SAM_AT
Language:Python182
datamllab/LongLM
[ICML'24 Spotlight] LLM Maybe LongLM: Self-Extend LLM Context Window Without Tuning
Language:Python59759
marlbenchmark/on-policy
This is the official implementation of Multi-Agent PPO (MAPPO).
Language:Python1.3k291
gbaydin/hypergradient-descent
Hypergradient descent
Language:Python13720
allenbai01/transformers-as-statisticians
Language:Jupyter Notebook258
kach/gradient-descent-the-ultimate-optimizer
Code for our NeurIPS 2022 paper
Language:Python36022
QingruZhang/AdaLoRA
AdaLoRA: Adaptive Budget Allocation for Parameter-Efficient Fine-Tuning (ICLR 2023).
Language:Python25828
osehmathias/lisa
LISA: Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning
Language:Python141
IST-DASLab/spops
Language:C++6
Outsider565/LoRA-GA
Language:Jupyter Notebook1315

TrueNobility303

TrueNobility303's Stars

yaircarmon/recapp

Ledzy/BAdam

hiyouga/LLaMA-Factory

gsmalinovsky/ProxSkip-Public

alshedivat/al-folio

x-zho14/MAPLE

Raymond30/CG-BiO

danielle-hausler/ms-optimal

tatsu-lab/stanford_alpaca

sowmaster/esjacobians

2003pro/ScaleBiO

phquang/Contextual-Transformation-Network

Chavdarova/LAGAN-Lookahead_Minimax

bojone/rerope

bojone/NBCE

LIONS-EPFL/BiSAM

ZhuiyiTechnology/roformer

yang-song/score_sde

yang-song/score_sde_pytorch

OPTML-Group/DeepZero

weizeming/SAM_AT

datamllab/LongLM

marlbenchmark/on-policy

gbaydin/hypergradient-descent

allenbai01/transformers-as-statisticians

kach/gradient-descent-the-ultimate-optimizer

QingruZhang/AdaLoRA

osehmathias/lisa

IST-DASLab/spops

Outsider565/LoRA-GA