Oneflow-Model-Compression
概述
炼知技术平台是一个模型压缩平台,包含剪枝、量化、知识蒸馏等一系列模型压缩策略。 提供完整的模型压缩解决方案,可用于各种类型的自然语言和计算机视觉场景,如文本分类、推理,图像分类等。 另外,平台在不断完善各种压缩策略在经典开源任务的Benchmark,以便用户参考。 同时,平台也提供各种压缩策略的功能算子,方便用户使用、复现最新的论文方法,以及利用压缩算子进行二次开发。
功能
使用
- Oneflow介绍: 深度学习框架Oneflow介绍以及环境安装说明。
- Oneflow快速开始:通过简单示例介绍如何快速3分钟上手使用Oneflow。
- 模型压缩API文档:用户接口文档,包含以下功能
- 高阶教程:包括在CV和NLP等应用场景任务的使用示例、算法使用步骤,高级特性的使用教程。
- 量化功能文档: 介绍量化功能使用示例,主要包含int8量化。
- 剪枝功能文档: 介绍通道剪枝实现和使用示例,只要包括CNN模型、DNN模型的不同剪枝算子。
- 知识蒸馏功能文档: 介绍知识蒸馏功能相关论文实现和使用示例,主要包含KD, Distilled-BiLSTM, BERT-PKD, TinyBERT, BERT-Theseus等算法。
- TensorRT量化部署: 介绍如何使用TensorRT部署量化得到的Oneflow模型。
- 模型库:各个压缩算法在文本分类、推理,图像分类等数据集上的实验结果,包括模型精度、模型尺寸和推理速度。