int8-inference

There are 13 repositories under int8-inference topic.

anilsathyan7/Portrait-Segmentation
Real-time portrait segmentation for mobile devices
Language:Jupyter Notebook645 28 53134
BUG1989/caffe-int8-convert-tools
Generate a quantization parameter file for ncnn framework int8 inference
Language:Python521 27 65153
DerryHub/BEVFormer_tensorrt
BEVFormer inference on TensorRT, including INT8 Quantization and Custom TensorRT Plugins (float/half/half2/int8).
Language:Python452 5 8172
jahongir7174/YOLOv8-qat
Quantization Aware Training
Language:Python61 0 99
Howell-Yang/onnx2trt
将端上模型部署过程中，常见的问题以及解决办法记录并汇总，希望能给其他人带来一点帮助。
Language:Python16 2 11
whitelok/tensorrt-int8-python-sample
TensorRT Int8 Python version sample. TensorRT Int8 Python 实现例子。TensorRT Int8 Pythonの例です
Language:Python14 3 21
ENOT-AutoDL/gpt-j-6B-tensorrt-int8
GPT-J 6B inference on TensorRT with INT-8 precision
Language:Python12 2 00
ENOT-AutoDL/ENOT-transformers
7 2 01
JohnClaw/chatllm.vb
VB.NET api wrapper for llm-inference chatllm.cpp
Language:Visual Basic .NET4 1 00
yester31/TensorRT_ONNX
Generating tensorrt model using onnx
Language:C++4 1 01
JohnClaw/chatllm.cs
C# api wrapper for llm-inference chatllm.cpp
Language:C#3 1 00
akashAD98/yolov7_vino_with_object_tracking
it has support for openvino converted model of yolov7-int.xml ,yolov7x,
Language:Python1 1 12
daniel-rychlewski/cnn-planesnet
Compressed CNNs for airplane classification in satellite images (APoZ-based parameter pruning, INT8 weight quantization)
Language:Python1 1 00

int8-inference

anilsathyan7/Portrait-Segmentation

BUG1989/caffe-int8-convert-tools

DerryHub/BEVFormer_tensorrt

jahongir7174/YOLOv8-qat

Howell-Yang/onnx2trt

whitelok/tensorrt-int8-python-sample

ENOT-AutoDL/gpt-j-6B-tensorrt-int8

ENOT-AutoDL/ENOT-transformers

JohnClaw/chatllm.vb

yester31/TensorRT_ONNX

JohnClaw/chatllm.cs

akashAD98/yolov7_vino_with_object_tracking

daniel-rychlewski/cnn-planesnet