CoderLSF

Never stop coding!

DuBeijing

Pinned Repositories

DeepSpeed
DeepSpeed is a deep learning optimization library that makes distributed training and inference easy, efficient, and effective.
Language:Python0 0 00
DeepSpeed-MII
MII makes low-latency and high-throughput inference possible, powered by DeepSpeed.
Language:Python0 0 00
fast-llama
Runs LLaMA with Extremely HIGH speed
Language:C++88 7 69
ftl
C++ Fast Template Libraries
Language:C++0 1 00
KVQuant
KVQuant: Towards 10 Million Context Length LLM Inference with KV Cache Quantization
Language:Python00
Latte
The official implementation of Latte: Latent Diffusion Transformer for Video Generation.
Language:Python00
learn_dl
Deep learning algorithms source code for beginners
Language:Python0 0 00
llm-inference-acceleration-handbook
2 1 00
LookaheadDecoding
Language:Python1 0 00
rapid-llama-src
0 1 00

CoderLSF's Repositories

CoderLSF/fast-llama
Runs LLaMA with Extremely HIGH speed
Language:C++88 7 69
CoderLSF/llm-inference-acceleration-handbook
2 1 00
CoderLSF/LookaheadDecoding
Language:Python1 0 00
CoderLSF/DeepSpeed
DeepSpeed is a deep learning optimization library that makes distributed training and inference easy, efficient, and effective.
Language:Python0 0 00
CoderLSF/DeepSpeed-MII
MII makes low-latency and high-throughput inference possible, powered by DeepSpeed.
Language:Python0 0 00
CoderLSF/ftl
C++ Fast Template Libraries
Language:C++0 1 00
CoderLSF/KVQuant
KVQuant: Towards 10 Million Context Length LLM Inference with KV Cache Quantization
Language:Python00
CoderLSF/Latte
The official implementation of Latte: Latent Diffusion Transformer for Video Generation.
Language:Python00
CoderLSF/learn_dl
Deep learning algorithms source code for beginners
Language:Python0 0 00
CoderLSF/rapid-llama-src
0 1 00