zhihu/cuBERT

Fast implementation of BERT inference directly on NVIDIA (CUDA, CUBLAS) and Intel MKL

C++MIT

Readme
42Issues
541Stargazers
21Watchers

Watchers

breezewoods
Beijing
chros425
eemailme
ericxsun
@cins-china
fangkuann
UESTC
girisandeep
CloudxLab, Inc
hugesea
jhcloos
KaimingGao
beijing
kevin-xw
levyfan
Zhihu
lin72h
lovetimil
lsbigboy
Magnus6803
MJ Kontorsservice
ntzzc
PassByYou888
PerfectWzp
Peking University
taomiao
Peking University @China
yushcs
zmxdream
Baidu

Contact site admin: Geeks.