sitabulaixizawaluduo

Pinned Repositories

flashinfer
FlashInfer: Kernel Library for LLM Serving
Language:Cuda1.8k 21 160179
lmdeploy
LMDeploy is a toolkit for compressing, deploying, and serving LLMs.
Language:Python5.2k 41 1.6k457
DistServe
Disaggregated serving system for Large Language Models (LLMs).
Language:Jupyter Notebook437 5 4550
openvino
OpenVINO™ is an open-source toolkit for optimizing and deploying AI inference
Language:C++7.6k 195 2.7k2.4k
sglang
SGLang is a fast serving framework for large language models and vision language models.
Language:Python7.3k 66 880697
vllm-prefix-caching
A high-throughput and memory-efficient inference and serving engine for LLMs
Language:Python0 0 00
Wine-Quality-Analysis
用机械学习分析和分类好质量的红酒特征
Language:R0 0 00
ScaleLLM
A high-performance inference system for large language models, designed for production environments.
Language:C++403 17 7630
vllm
A high-throughput and memory-efficient inference and serving engine for LLMs
Language:Python33.7k 275 5.9k5.1k
inference-server
Language:C++43 11 9413

sitabulaixizawaluduo's Repositories

sitabulaixizawaluduo/vllm-prefix-caching
A high-throughput and memory-efficient inference and serving engine for LLMs
Language:Python0 0 00
sitabulaixizawaluduo/Wine-Quality-Analysis
用机械学习分析和分类好质量的红酒特征
Language:R0 0 00