skydoorkai

Pinned Repositories

TransformerEngine
A library for accelerating Transformer models on NVIDIA GPUs, including using 8-bit floating point (FP8) precision on Hopper and Ada GPUs, to provide better performance with lower memory utilization in both training and inference.
Language:Python2.1k 33 379349
caffe
Caffe: a fast open framework for deep learning.
Language:C++0 1 00
CuMF
CUDA-Acclerated ALS on mulitple GPUs
Language:Cuda0 1 00
dlrover
DLRover: An Automatic Distributed Deep Learning System
Language:Python0 0 00
elasticdl.github.io
Language:CSS0 0 00
ftlib
Fault-tolerant for DL frameworks
Language:Python0 0 00
tests_and_issues
Language:Python0 1 00
TransformerEngine
A library for accelerating Transformer models on NVIDIA GPUs, including using 8-bit floating point (FP8) precision on Hopper and Ada GPUs, to provide better performance with lower memory utilization in both training and inference.
Language:Python0 0 00
util-tf
0 1 00
word2vec
Automatically exported from code.google.com/p/word2vec
Language:C0 0 370

skydoorkai's Repositories

skydoorkai/caffe
Caffe: a fast open framework for deep learning.
Language:C++0 1 00
skydoorkai/CuMF
CUDA-Acclerated ALS on mulitple GPUs
Language:Cuda0 1 00
skydoorkai/dlrover
DLRover: An Automatic Distributed Deep Learning System
Language:Python0 0 00
skydoorkai/elasticdl.github.io
Language:CSS0 0 00
skydoorkai/ftlib
Fault-tolerant for DL frameworks
Language:Python0 0 00
skydoorkai/tests_and_issues
Language:Python0 1 00
skydoorkai/TransformerEngine
A library for accelerating Transformer models on NVIDIA GPUs, including using 8-bit floating point (FP8) precision on Hopper and Ada GPUs, to provide better performance with lower memory utilization in both training and inference.
Language:Python0 0 00
skydoorkai/util-tf
0 1 00
skydoorkai/word2vec
Automatically exported from code.google.com/p/word2vec
Language:C0 0 370