Vahe1994/AQLM

Official Pytorch repository for Extreme Compression of Large Language Models via Additive Quantization https://arxiv.org/pdf/2401.06118.pdf and PV-Tuning: Beyond Straight-Through Estimation for Extreme LLM Compression https://arxiv.org/abs/2405.14852

PythonApache-2.0

Watchers

4lev
bbboy1901
BlackSamorez
ISTA
dalistarh
IST Austria & Neural Magic
drkostas
University of Tennessee, Knoxville
eemailme
ghchris2021
igvasilev
France
itzhexen
JohnClaw
justheuristic
YSDA
Mayorc1978
online2311
Qubitium
ModelCloud.ai
rmusser01
Someplace
ryusaeba
surgaev
Moscow
Vahe1994
SHAD
wx-b
RIOS