dtlzhuangz

Netease Fuxi AI LabHangzhou

Pinned Repositories

3D-Speaker
A Repository for Single- and Multi-modal Speaker Verification, Speaker Recognition and Speaker Diarization
Language:Python0 0 00
CUDA-Learn-Note
🎉CUDA 笔记 / 高频面试题汇总 / C++笔记，个人笔记，更新随缘: sgemm、sgemv、warp reduce、block reduce、dot product、elementwise、softmax、layernorm、rmsnorm、hist etc.
Language:Cuda1 0 00
cuda-samples
Samples for CUDA Developers which demonstrates features in CUDA Toolkit
Language:C0 0 00
cutlass_quant
Playing with quantization
Language:HTML0 0 00
dtlzhuangz
0 1 00
EAGLE
[ICML'24] EAGLE: Speculative Sampling Requires Rethinking Feature Uncertainty
Language:Python0 0 00
EETQ
Easy and Efficient Quantization for Transformers
Language:C++0 0 00
FunASR
A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Recognition, Voice Activity Detection, Text Post-processing etc.
Language:Python0 0 00
How_to_optimize_in_GPU
This is a series of GPU optimization topics. Here we will introduce how to optimize the CUDA kernel in detail. I will introduce several basic kernel optimizations, including: elementwise, reduce, sgemv, sgemm, etc. The performance of these kernels is basically at or near the theoretical limit.
Language:Cuda0 0 00
HPC-Learning-Notes
高性能计算相关知识学习笔记，包含学习笔记和相关知识的代码demo，在持续完善中。如果有帮助的话请Star一下，对作者帮助很大，谢谢！
Language:Jupyter Notebook0 0 00

dtlzhuangz's Repositories

dtlzhuangz/CUDA-Learn-Note
🎉CUDA 笔记 / 高频面试题汇总 / C++笔记，个人笔记，更新随缘: sgemm、sgemv、warp reduce、block reduce、dot product、elementwise、softmax、layernorm、rmsnorm、hist etc.
Language:Cuda1 0 00
dtlzhuangz/3D-Speaker
A Repository for Single- and Multi-modal Speaker Verification, Speaker Recognition and Speaker Diarization
Language:Python0 0 00
dtlzhuangz/cuda-samples
Samples for CUDA Developers which demonstrates features in CUDA Toolkit
Language:C0 0 00
dtlzhuangz/cutlass_quant
Playing with quantization
Language:HTML0 0 00
dtlzhuangz/dtlzhuangz
0 1 00
dtlzhuangz/EAGLE
[ICML'24] EAGLE: Speculative Sampling Requires Rethinking Feature Uncertainty
Language:Python0 0 00
dtlzhuangz/EETQ
Easy and Efficient Quantization for Transformers
Language:C++0 0 00
dtlzhuangz/FunASR
A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Recognition, Voice Activity Detection, Text Post-processing etc.
Language:Python0 0 00
dtlzhuangz/How_to_optimize_in_GPU
This is a series of GPU optimization topics. Here we will introduce how to optimize the CUDA kernel in detail. I will introduce several basic kernel optimizations, including: elementwise, reduce, sgemv, sgemm, etc. The performance of these kernels is basically at or near the theoretical limit.
Language:Cuda0 0 00
dtlzhuangz/HPC-Learning-Notes
高性能计算相关知识学习笔记，包含学习笔记和相关知识的代码demo，在持续完善中。如果有帮助的话请Star一下，对作者帮助很大，谢谢！
Language:Jupyter Notebook0 0 00
dtlzhuangz/Learn-CUDA-Programming
Learn CUDA Programming, published by Packt
Language:Cuda0 0 00
dtlzhuangz/lectures
Material for cuda-mode lectures
Language:Jupyter Notebook0 0
dtlzhuangz/test
1 0
dtlzhuangz/text-generation-inference
Large Language Model Text Generation Inference
Language:Python0 0
dtlzhuangz/vllm
A high-throughput and memory-efficient inference and serving engine for LLMs
Language:Python0 0

dtlzhuangz

Pinned Repositories

3D-Speaker

CUDA-Learn-Note

cuda-samples

cutlass_quant

dtlzhuangz

EAGLE

EETQ

FunASR

How_to_optimize_in_GPU

HPC-Learning-Notes

dtlzhuangz's Repositories

dtlzhuangz/CUDA-Learn-Note

dtlzhuangz/3D-Speaker

dtlzhuangz/cuda-samples

dtlzhuangz/cutlass_quant

dtlzhuangz/dtlzhuangz

dtlzhuangz/EAGLE

dtlzhuangz/EETQ

dtlzhuangz/FunASR

dtlzhuangz/How_to_optimize_in_GPU

dtlzhuangz/HPC-Learning-Notes

dtlzhuangz/Learn-CUDA-Programming

dtlzhuangz/lectures

dtlzhuangz/test

dtlzhuangz/text-generation-inference

dtlzhuangz/vllm