ModelTC

Model Infra

Pinned Repositories

awesome-lm-system
Summary of system papers/frameworks/codes/tools on training or serving large model
57 8 05
Dipoorlet
Offline Quantization Tools for Deploy.
Language:Python141 14 1219
LightCompress
[EMNLP 2024 & AAAI 2026] A powerful toolkit for compressing large models including LLM, VLM, and video generation models.
Language:Python614 9 9863
LightLLM
LightLLM is a Python-based LLM (Large Language Model) inference and serving framework, notable for its lightweight design, easy scalability, and high-speed performance.
Language:Python3.7k 31 225283
LightX2V
Light Video Generation Inference Framework
Language:Python787 10 7949
MQBench
Model Quantization Benchmark
Language:Python849 13 207142
Qwen-Image-Lightning
Qwen-Image-Lightning: Speed up Qwen-Image model with distillation
Language:Python931 12 3937
TFMQ-DM
[CVPR 2024 Highlight & TPAMI 2025] This is the official PyTorch implementation of "TFMQ-DM: Temporal Feature Maintenance Quantization for Diffusion Models".
Language:Jupyter Notebook106 8 124
United-Perception
United Perception
Language:Python435 19 6767
Wan2.2-Lightning
Wan2.2-Lightning: Speed up wan2.2 model with distillation
Language:Python216 5 1814

ModelTC's Repositories

ModelTC/United-Perception
United Perception
Language:Python435 19 6767
ModelTC/Dipoorlet
Offline Quantization Tools for Deploy.
Language:Python141 14 1219
ModelTC/awesome-lm-system
Summary of system papers/frameworks/codes/tools on training or serving large model
57 8 05
ModelTC/Outlier_Suppression_Plus
Official implementation of the EMNLP23 paper: Outlier Suppression+: Accurate quantization of large language models by equivalent and optimal shifting and scaling
Language:Python47 8 64
ModelTC/mqbench-paper
Language:Python44 8 39
ModelTC/rank_dataset
PyTorch Dataset Rank Dataset
Language:Python43 4 210
ModelTC/QLLM
[ICLR 2024] This is the official PyTorch implementation of "QLLM: Accurate and Efficient Low-Bitwidth Quantization for Large Language Models"
Language:Python38 8 24
ModelTC/NART
NART = NART is not A RunTime, a deep learning inference framework.
Language:Python37 10 114
ModelTC/NNLQP
Language:Python36 2 84
ModelTC/LPCV2021_Winner_Solution
Language:Python28 5 27
ModelTC/pyvlova
Yet another Polyhedra Compiler for DeepLearning
Language:Python19 4 04
ModelTC/LPCV_2023_solution
Language:Python18 1 12
ModelTC/Prototype
Language:Python14 6 03
ModelTC/AAAI2023_EAMPD
AAAI2023 Efficient and Accurate Models towards Practical Deep Learning Baseline
13 7 21
ModelTC/L2_Compression
Language:Python13 7 10
ModelTC/msbench
A tool for model sparse based on torch.fx
Language:Python13 7 02
ModelTC/FCPTS
Language:Python5 7 01
ModelTC/Imagenet-S
Robustness for real-world system noise
Language:Python4 2 1
ModelTC/ChatGLM-6B
ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型
Language:Python2 1 0
ModelTC/pyrotom
Python Code Hotfix and Refactor on the fly
Language:Python1 3 0
ModelTC/statecs
Language:Rust1 7 01
ModelTC/InternVL
[CVPR 2024 Oral] InternVL Family: A Pioneering Open-Source Alternative to GPT-4o. 接近GPT-4o表现的可商用开源多模态对话模型
Language:Python0 0
ModelTC/systemnoise_web
Language:HTML5 0
ModelTC/tvm-vit
5 02
ModelTC/UNRT
UNiversal RunTime
6 0
ModelTC/UP_LPCV2023_Plugin
Language:Python0 0

ModelTC

Pinned Repositories

awesome-lm-system

Dipoorlet

LightCompress

LightLLM

LightX2V

MQBench

Qwen-Image-Lightning

TFMQ-DM

United-Perception

Wan2.2-Lightning

ModelTC's Repositories

ModelTC/United-Perception

ModelTC/Dipoorlet

ModelTC/awesome-lm-system

ModelTC/Outlier_Suppression_Plus

ModelTC/mqbench-paper

ModelTC/rank_dataset

ModelTC/QLLM

ModelTC/NART

ModelTC/NNLQP

ModelTC/LPCV2021_Winner_Solution

ModelTC/pyvlova

ModelTC/LPCV_2023_solution

ModelTC/Prototype

ModelTC/AAAI2023_EAMPD

ModelTC/L2_Compression

ModelTC/msbench

ModelTC/FCPTS

ModelTC/Imagenet-S

ModelTC/ChatGLM-6B

ModelTC/pyrotom

ModelTC/statecs

ModelTC/InternVL

ModelTC/systemnoise_web

ModelTC/tvm-vit

ModelTC/UNRT

ModelTC/UP_LPCV2023_Plugin