mit-han-lab/spatten-llm

[HPCA'21] SpAtten: Efficient Sparse Attention Architecture with Cascade Token and Head Pruning

ScalaMIT

Readme
1Issue
51Stargazers
8Watchers

Stargazers

Prev
Next

Contact site admin: Geeks.