LHQUer

ShenZhen University

Pinned Repositories

FlexLLMGen
Running large language models on a single GPU for throughput-oriented scenarios.
Language:Python9.2k 111 83549
inferflow
Inferflow is an efficient and highly configurable inference engine for large language models (LLMs).
Language:C++236 8 1624
stable-diffusion-webui
Stable Diffusion web UI
Language:Python00
distrifuser
[CVPR 2024 Highlight] DistriFusion: Distributed Parallel Inference for High-Resolution Diffusion Models
Language:Python596 9 2324
PowerInfer
High-speed Large Language Model Serving on PCs with Consumer-grade GPUs
Language:C++8k 77 168415