kongroo

ByteDanceBeijing

Pinned Repositories

tvm
Open deep learning compiler stack for cpu, gpu and specialized accelerators
Language:Python11.4k 381 3.3k3.4k
ByteTransformer
optimized BERT transformer inference on NVIDIA GPU. https://arxiv.org/abs/2210.03052
Language:C++432 10 1033
acm
competitive programming templates
Language:C++2 1 00
cutlass
CUDA Templates for Linear Algebra Subroutines
Language:C++00
docker_devenv
docker developing environment, ubuntu
Language:Python10
docker_vim_ycm
vim with ycm compiled
Language:Dockerfile00
Huawei-CodeCraft-2019
2019华为软件精英挑战赛，杭夏赛区-咕咕咕，决赛冠军
Language:C++109 1 026
matxscript
A high-performance, extensible Python AOT compiler.
Language:C++00
tvm
Open deep learning compiler stack for cpu, gpu and specialized accelerators
Language:Python00
cutlass
CUDA Templates for Linear Algebra Subroutines
Language:C++4.8k 105 905823

kongroo's Repositories

kongroo/Huawei-CodeCraft-2019
2019华为软件精英挑战赛，杭夏赛区-咕咕咕，决赛冠军
Language:C++109 1 026
kongroo/acm
competitive programming templates
Language:C++2 1 00
kongroo/docker_devenv
docker developing environment, ubuntu
Language:Python10
kongroo/cutlass
CUDA Templates for Linear Algebra Subroutines
Language:C++00
kongroo/docker_vim_ycm
vim with ycm compiled
Language:Dockerfile00
kongroo/matxscript
A high-performance, extensible Python AOT compiler.
Language:C++00
kongroo/tvm
Open deep learning compiler stack for cpu, gpu and specialized accelerators
Language:Python00