mit-han-lab/llm-awq

[MLSys 2024 Best Paper Award] AWQ: Activation-aware Weight Quantization for LLM Compression and Acceleration

PythonMIT

Readme
193Issues
2.6kStargazers
24Watchers

Watchers

0xez
Melbourne
AlbertBJ
Beijing, China
cetium
Beijing ,China
ctejada85
doctorimage
eemailme
ghchris2021
gonnavis
@webaverse
jamesdborin
jnulzl
GuangZhou China
kdy1999
liuguoyou
LuukvE
Freelance
meenchen
nanggiomientrung
Vietnam
nirvanesque
Accenture
Qubitium
ModelCloud.ai
Sakits
MIT, EECS
shayanc1985
songhan
MIT, NVIDIA
songkq
tonylins
MIT, EECS
vince62s
Seedfall
wx-b
RIOS

Contact site admin: geeksiteservice@gmail.com.