quantization-aware-training

There are 58 repositories under quantization-aware-training topic.

666DZY666/micronet
micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference)、Low-Bit(≤2b)/Ternary and Binary(TWN/BNN/XNOR-Net); post-training-quantization(PTQ), 8-bit(tensorrt); 2、 pruning: normal、regular and group convolutional channel pruning; 3、 group convolution structure; 4、batch-normalization fuse for quantization. deploy: tensorrt, fp32/fp16/int8(ptq-calibration)、op-adapt(upsample)、dynamic_shape
Language:Python2.2k 40 109477
intel/neural-compressor
SOTA low-bit LLM quantization (INT8/FP8/INT4/FP4/NF4) & sparsity; leading model compression techniques on TensorFlow, PyTorch, and ONNX Runtime
Language:Python2k 34 187247
openvinotoolkit/nncf
Neural Network Compression Framework for enhanced OpenVINO™ inference
Language:Python841 30 300211
alibaba/TinyNeuralNetwork
TinyNeuralNetwork is an efficient and easy-to-use deep learning model compression framework.
Language:Python719 21 131118
SpursLipu/YOLOv3v4-ModelCompression-MultidatasetTraining-Multibackbone
YOLO ModelCompression MultidatasetTraining
Language:Python443 8 130136
megvii-research/Sparsebit
A model compression and acceleration toolbox based on pytorch.
Language:Python322 12 3040
fastmachinelearning/hls4ml-tutorial
Tutorial notebooks for hls4ml
Language:Jupyter Notebook267 16 33121
Beomi/BitNet-Transformers
0️⃣1️⃣🤗 BitNet-Transformers: Huggingface Transformers Implementation of "BitNet: Scaling 1-bit Transformers for Large Language Models" in pytorch with Llama(2) Architecture
Language:Python244 9 930
THU-MIG/torch-model-compression
针对pytorch模型的自动化模型结构分析和修改工具集，包含自动分析模型结构的模型压缩算法库
Language:Python220 12 2039
sayakpaul/Adventures-in-TensorFlow-Lite
This repository contains notebooks that show the usage of TensorFlow Lite for quantizing deep neural networks.
Language:Jupyter Notebook169 12 633
clovaai/frostnet
FrostNet: Towards Quantization-Aware Network Architecture Search
Language:Python106 7 318
openvinotoolkit/mmdetection
OpenVINO Training Extensions Object Detection
Language:Python93 8 2130
jahongir7174/YOLOv8-qat
Quantization Aware Training
Language:Python44 0 65
mlzxy/qsparse
Train neural networks with joint quantization and pruning on both weights and activations using any pytorch modules
Language:Python40 2 12
hkproj/quantization-notes
Notes on quantization in neural networks
Language:Jupyter Notebook39 2 110
yashbhalgat/QualcommAI-MicroNet-submission-MixNet
3rd place solution for NeurIPS 2019 MicroNet challenge
Language:Python35 4 16
DeadAt0m/LSQFakeQuantize-PyTorch
FakeQuantize with Learned Step Size(LSQ+) as Observer in PyTorch
Language:C++32 1 35
jeshraghian/QSNNs
Quantization-aware training with spiking neural networks
Language:Python32 3 14
bharathsudharsan/CNN_on_MCU
Code for paper 'Multi-Component Optimization and Efficient Deployment of Neural-Networks on Resource-Constrained IoT Hardware'
Language:Jupyter Notebook24 4 019
HaoranREN/TensorFlow_Model_Quantization
A tutorial of model quantization using TensorFlow
Language:Python12 1 03
Intelligent-Microsystems-Lab/SNNQuantPrune
Code for the ISCAS23 paper "The Hardware Impact of Quantization and Pruning for Weights in Spiking Neural Networks"
Language:Python10 2 13
rishivar/Resnet-18
Image classification done with Mindspore technology
Language:Python8 2 02
HanByulKim/BASQ
BASQ: Branch-wise Activation-clipping Search Quantization for Sub-4-bit Neural Networks, ECCV 2022
Language:Python7 3 00
gulabpatel/Knowledge_Distillation
Language:Jupyter Notebook5 1 0
LorenzoValente3/Autoencoder-for-FPGA
Autoencoder model for FPGA implementation using hls4ml. Repository for Applied Electronics Project.
Language:Jupyter Notebook4 1 03
SangbumChoi/PyTorch_Quantization
all methods of pytorch quantization based on resnet50
Language:Python4 2 00
yashbhalgat/QualcommAI-MicroNet-submission-EfficientNet
Submission name: QualcommAI-EfficientNet. MicroNet Challenge (NeurIPS 2019) submission - Qualcomm AI Research
Language:Python4 3 24
yester31/Quantization_EX
quantization example for pqt & qat
Language:Python4 1 02
etetteh/OoD_Gen-Chest_Xray
Multi-Domain Balanced Sampling Improves Out-of-Distribution Generalization of Chest X-ray Pathology Prediction Models
Language:Python3 4 01
LorenzoValente3/JointVAE4AD
Disentangle joint continous and discrete representations for Anomaly Detection in High Energy Physics.
Language:Jupyter Notebook3 2 00
marekninja/master-thesis
One Bit at a Time: Impact of Quantisation on Neural Machine Translation
Language:Jupyter Notebook3 1 10
satya15july/quantization
Model Quantization with Pytorch, Tensorflow & Larq
Language:C++2 2 01
yashmaniya0/Quantization-of-Image-Classification-Models
Comprehensive study on the quantization of various CNN models, employing techniques such as Post-Training Quantization and Quantization Aware Training (QAT).
Language:Jupyter Notebook2 1 00
lix19937/pytorch-quantization
QAT
Language:Python1 2 00
moshiurtonmoy/A-Lightweight-Visual-Font-Style-Recognition-with-Quantized-Convolutional-Autoencoder
A lightweight Convolutional Autoencoder for recognizing Bangla font styles along with quantization for deploying resource-constrained IoT devices.
Language:Jupyter Notebook1 1 00
yihong1120/YOLOv8-qat
Quantization Aware Training
Language:Python1 0 2

quantization-aware-training

666DZY666/micronet

intel/neural-compressor

openvinotoolkit/nncf

alibaba/TinyNeuralNetwork

SpursLipu/YOLOv3v4-ModelCompression-MultidatasetTraining-Multibackbone

megvii-research/Sparsebit

fastmachinelearning/hls4ml-tutorial

Beomi/BitNet-Transformers

THU-MIG/torch-model-compression

sayakpaul/Adventures-in-TensorFlow-Lite

clovaai/frostnet

openvinotoolkit/mmdetection

jahongir7174/YOLOv8-qat

mlzxy/qsparse

hkproj/quantization-notes

yashbhalgat/QualcommAI-MicroNet-submission-MixNet

DeadAt0m/LSQFakeQuantize-PyTorch

jeshraghian/QSNNs

bharathsudharsan/CNN_on_MCU

HaoranREN/TensorFlow_Model_Quantization

Intelligent-Microsystems-Lab/SNNQuantPrune

rishivar/Resnet-18

HanByulKim/BASQ

gulabpatel/Knowledge_Distillation

LorenzoValente3/Autoencoder-for-FPGA

SangbumChoi/PyTorch_Quantization

yashbhalgat/QualcommAI-MicroNet-submission-EfficientNet

yester31/Quantization_EX

etetteh/OoD_Gen-Chest_Xray

LorenzoValente3/JointVAE4AD

marekninja/master-thesis

satya15july/quantization

yashmaniya0/Quantization-of-Image-Classification-Models

lix19937/pytorch-quantization

moshiurtonmoy/A-Lightweight-Visual-Font-Style-Recognition-with-Quantized-Convolutional-Autoencoder

yihong1120/YOLOv8-qat