sleepwalker2017

Pinned Repositories

attention-is-all-you-need-pytorch
A PyTorch implementation of the Transformer model in "Attention is All You Need".
Language:Python0 0 00
auto-gptq-debug
Language:Python0 1 00
Books-1
0 0 00
compute-sanitizer-samples
Samples demonstrating how to use the Compute Sanitizer Tools and Public API
Language:Cuda1 0 00
FasterTransformer_llama_torch
Transformer related optimization, including BERT, GPT
Language:C++0 0 00
gperftools
Main gperftools repository
Language:C++0 0 00
incubator-tvm
Open deep learning compiler stack for cpu, gpu and specialized accelerators
Language:Python0 0 00
learn_cutlass
Language:Cuda0 1 00
lmdeploy
LMDeploy is a toolkit for compressing, deploying, and serving LLMs.
Language:C++0 0 00
mlc-llm
Enable everyone to develop, optimize and deploy AI models natively on everyone's devices.
Language:Python0 0 00

sleepwalker2017's Repositories

sleepwalker2017/compute-sanitizer-samples
Samples demonstrating how to use the Compute Sanitizer Tools and Public API
Language:Cuda1 0 00
sleepwalker2017/attention-is-all-you-need-pytorch
A PyTorch implementation of the Transformer model in "Attention is All You Need".
Language:Python0 0 00
sleepwalker2017/auto-gptq-debug
Language:Python0 1 00
sleepwalker2017/Books-1
0 0 00
sleepwalker2017/FasterTransformer_llama_torch
Transformer related optimization, including BERT, GPT
Language:C++0 0 00
sleepwalker2017/gperftools
Main gperftools repository
Language:C++0 0 00
sleepwalker2017/incubator-tvm
Open deep learning compiler stack for cpu, gpu and specialized accelerators
Language:Python0 0 00
sleepwalker2017/learn_cutlass
Language:Cuda0 1 00
sleepwalker2017/lmdeploy
LMDeploy is a toolkit for compressing, deploying, and serving LLMs.
Language:C++0 0 00
sleepwalker2017/mlc-llm
Enable everyone to develop, optimize and deploy AI models natively on everyone's devices.
Language:Python0 0 00
sleepwalker2017/MobileNet-v2-caffe
MobileNet-v2 experimental network description for caffe
0 0 00
sleepwalker2017/sanitizers
AddressSanitizer, ThreadSanitizer, MemorySanitizer
Language:C++0 0 00
sleepwalker2017/ptb_text_only
Language:Python
sleepwalker2017/triton
Language:C++1 0
sleepwalker2017/vllm
A high-throughput and memory-efficient inference and serving engine for LLMs
Language:Python0 0