leizhao1234

Pinned Repositories

flash-attention
Fast and memory-efficient exact attention
Language:Python13.6k 115 1k1.2k
tokenizers
💥 Fast State-of-the-Art Tokenizers optimized for Research and Production
Language:Rust8.9k 119 983776
cogvlm2
Large Language Model Text Generation Inference
Language:Python7 0 01
cute-gemm
cute-gemm
Language:C++0 0 00
cutlass
CUDA Templates for Linear Algebra Subroutines
Language:C++0 0 00
FasterTransformer
Transformer related optimization, including BERT, GPT
Language:C++00
flash-attention
Fast and memory-efficient exact attention
Language:Python0 0 00
Megatron-LM
Ongoing research training transformer models at scale
Language:Python0 0 00
SwissArmyTransformer
SwissArmyTransformer is a flexible and powerful library to develop your own Transformer variants.
Language:Python00
TransformerEngine
A library for accelerating Transformer models on NVIDIA GPUs, including using 8-bit floating point (FP8) precision on Hopper and Ada GPUs, to provide better performance with lower memory utilization in both training and inference.
Language:Python0 0 00

leizhao1234's Repositories

leizhao1234/cogvlm2
Large Language Model Text Generation Inference
Language:Python7 0 01
leizhao1234/cute-gemm
cute-gemm
Language:C++0 0 00
leizhao1234/cutlass
CUDA Templates for Linear Algebra Subroutines
Language:C++0 0 00
leizhao1234/FasterTransformer
Transformer related optimization, including BERT, GPT
Language:C++00
leizhao1234/flash-attention
Fast and memory-efficient exact attention
Language:Python0 0 00
leizhao1234/Megatron-LM
Ongoing research training transformer models at scale
Language:Python0 0 00
leizhao1234/SwissArmyTransformer
SwissArmyTransformer is a flexible and powerful library to develop your own Transformer variants.
Language:Python00
leizhao1234/TransformerEngine
A library for accelerating Transformer models on NVIDIA GPUs, including using 8-bit floating point (FP8) precision on Hopper and Ada GPUs, to provide better performance with lower memory utilization in both training and inference.
Language:Python0 0 00