sedrick-keh-tri

Pinned Repositories

RWKV-LM
RWKV is an RNN with transformer-level LLM performance. It can be directly trained like a GPT (parallelizable). So it's combining the best of RNN and transformer - great performance, fast inference, saves VRAM, fast training, "infinite" ctx_len, and free sentence embedding.
Language:Python11.8k 136 195814
megablocks
Language:Python1.1k 17 48153
lm-evaluation-harness
A framework for few-shot evaluation of language models.
Language:Python5.5k 36 8701.4k
transformers
🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.
Language:Python127k 1.1k 15k25.2k
Megatron-LM
Ongoing research training transformer models at scale
Language:Python9k 156 5512k
nccl
Optimized primitives for collective multi-GPU communication
Language:C++2.9k 151 1.1k744
composer
Supercharge Your Model Training
Language:Python00
megablocks
Language:Python00
open_lm_fork
A repository for research on medium sized language models.
Language:Python00
transformers
🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.
Language:Python00

sedrick-keh-tri's Repositories

sedrick-keh-tri/composer
Supercharge Your Model Training
Language:Python00
sedrick-keh-tri/megablocks
Language:Python00
sedrick-keh-tri/open_lm_fork
A repository for research on medium sized language models.
Language:Python00
sedrick-keh-tri/transformers
🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.
Language:Python00