LeshengJin

OctoMLRiverside

Pinned Repositories

tvm
Open deep learning compiler stack for cpu, gpu and specialized accelerators
Language:Python11.9k 378 3.4k3.5k
mlc-llm
Universal LLM Deployment Engine with ML Compilation
Language:Python19.5k 177 1.4k1.6k
relax
Language:Python152 5 2977

LeshengJin's Repositories

LeshengJin/chocopy-wasm-compiler-B
Language:TypeScript0 0 00
LeshengJin/FastChat
The release repo for "Vicuna: An Open Chatbot Impressing GPT-4"
Language:Python0 0 00
LeshengJin/mlc-llm
Enable everyone to develop, optimize and deploy AI models natively on everyone's devices.
Language:Python0 0 00
LeshengJin/mlc-relax
Language:Python0 0 00
LeshengJin/models
Models and examples built with TensorFlow
Language:Python0 0 00
LeshengJin/relax
Temp repo for prototyping relax(relay next), the effort will be upstreamed. We use the wiki pages on this repo to host design docs.
Language:Python0 0 01
LeshengJin/tvm
Open deep learning compiler stack for cpu, gpu and specialized accelerators
Language:Python0 0 00
LeshengJin/CTranslate2
Fast inference engine for Transformer models
Language:C++0 0
LeshengJin/faster-whisper
Faster Whisper transcription with CTranslate2
Language:Python0 0
LeshengJin/flashinfer
FlashInfer: Kernel Library for LLM Serving
Language:Cuda0 0
LeshengJin/libflash_attn
Standalone Flash Attention v2 kernel without libtorch dependency
Language:C++0 0
LeshengJin/llm-perf-bench
Language:Shell0 0
LeshengJin/rocm_test
Language:Python1 0
LeshengJin/sglang
SGLang is a fast serving framework for large language models and vision language models.
LeshengJin/Teradata-Smartix
Language:Python1 0
LeshengJin/web-llm
Bringing large-language models and chat to web browsers. Everything runs inside the browser with no server support.
Language:Python0 0
LeshengJin/whisper-jax
JAX implementation of OpenAI's Whisper model for up to 70x speed-up on TPU.
Language:Jupyter Notebook0 0
LeshengJin/whisperX
WhisperX: Automatic Speech Recognition with Word-level Timestamps (& Diarization)
Language:Python0 0

LeshengJin

Pinned Repositories

tvm

mlc-llm

relax

LeshengJin's Repositories

LeshengJin/chocopy-wasm-compiler-B

LeshengJin/FastChat

LeshengJin/mlc-llm

LeshengJin/mlc-relax

LeshengJin/models

LeshengJin/relax

LeshengJin/tvm

LeshengJin/CTranslate2

LeshengJin/faster-whisper

LeshengJin/flashinfer

LeshengJin/libflash_attn

LeshengJin/llm-perf-bench

LeshengJin/rocm_test

LeshengJin/sglang

LeshengJin/Teradata-Smartix

LeshengJin/web-llm

LeshengJin/whisper-jax

LeshengJin/whisperX