zheng-ningxin

http://zheng-ningxin.github.io/

Pinned Repositories

flux
A fast communication-overlapping library for tensor parallelism on GPUs.
Language:C++247 8 2621
nni
An open source AutoML toolkit for automate machine learning lifecycle, including feature engineering, neural architecture search, model compression and hyper-parameter tuning.
Language:Python14.1k 284 2.1k1.8k
SparTA
Language:Python132 10 1011
brp-nas
Language:Python12 2 20
Compression-Latency-Predictor
A latency predictor for the filter pruning.
Language:Python1 2 00
nmsparse
Language:Cuda3 2 00
nni
An open source AutoML toolkit for automate machine learning lifecycle, including feature engineering, neural architecture search, model compression and hyper-parameter tuning.
Language:Python1 1 00
Pruning-from-scratch
Language:Python17 3 13
Pytorch-Visualization
Libs to visuallize the network architecture automaticlly
Language:Python1 2 01
SparTA
Language:Cuda8 6 31

zheng-ningxin's Repositories

zheng-ningxin/brp-nas
Language:Python12 2 20
zheng-ningxin/SparTA
Language:Cuda8 6 31
zheng-ningxin/nmsparse
Language:Cuda3 2 00
zheng-ningxin/nni
An open source AutoML toolkit for automate machine learning lifecycle, including feature engineering, neural architecture search, model compression and hyper-parameter tuning.
Language:Python1 1 00
zheng-ningxin/SparseOP
1 2 00
zheng-ningxin/compression_exp
Language:Python00
zheng-ningxin/cuda-tensorcore-hgemm
Language:Cuda1 0
zheng-ningxin/CUDALibrarySamples
CUDA Library Samples
Language:Cuda1 0
zheng-ningxin/CustomizeOP
Language:C++2 0
zheng-ningxin/cutlass
CUDA Templates for Linear Algebra Subroutines
Language:C++
zheng-ningxin/FasterTransformer
Transformer related optimization, including BERT, GPT
Language:C++1 0
zheng-ningxin/flux
A fast communication-overlapping library for tensor parallelism on GPUs.
Language:C++
zheng-ningxin/gpu-sparsert
Language:Jupyter Notebook
zheng-ningxin/latency_raw_data
2 0
zheng-ningxin/LeViT
LeViT a Vision Transformer in ConvNet's Clothing for Faster Inference
Language:Python
zheng-ningxin/linux
Linux kernel source tree
Language:C1 0
zheng-ningxin/Mkl-Sparse
Language:C++2 0
zheng-ningxin/MLPruning
MLPruning, PyTorch, NLP, BERT, Structured Pruning
Language:Python
zheng-ningxin/nn_pruning
Prune a model while finetuning or training.
zheng-ningxin/nnfusion
A flexible and efficient deep neural network (DNN) compiler that generates high-performance executable from a DNN model description.
Language:C++1
zheng-ningxin/pytorch_block_sparse
Fast Block Sparse Matrices for Pytorch
Language:C++
zheng-ningxin/sparsednn
Fast sparse deep learning on CPUs
Language:Python1 0
zheng-ningxin/SparTA_Fork
Language:Python0 0
zheng-ningxin/sputnik
A library of GPU kernels for sparse matrix operations.
Language:C++
zheng-ningxin/test_pip
1 0
zheng-ningxin/transformers
🤗 Transformers: State-of-the-art Natural Language Processing for Pytorch, TensorFlow, and JAX.
Language:Python
zheng-ningxin/TurboTransformers
a fast and user-friendly runtime for transformer inference (Bert, Albert, GPT2, Decoders, etc) on CPU and GPU.
zheng-ningxin/tvm
Open deep learning compiler stack for cpu, gpu and specialized accelerators
Language:Python0 0
zheng-ningxin/Utils
Language:Python
zheng-ningxin/zheng-ningxin.github.io
Language:HTML