kst179/fused-attention

Fast and low-memory attention layer written in CUDA

Cuda

Readme
1Issue
13Stargazers
1Watcher

Stargazers

HuangliangDai
HUSTHY
China
ifromeast
Shanghai Jiao Tong University
ilyajob05
Antalya
juliakacher
UL & MSU
lvyufeng
Chongqing University
me1nna
St. Petersburg
neuer93
Umich
repollo
Norilabs
rhmaaa
Xynonners

Contact site admin: Geeks.