sophon-demo: A C++ repository from flyingcys

SOPHON-DEMO介绍

简介

SOPHON-DEMO基于SOPHONSDK接口进行开发，提供一系列主流算法的移植例程。包括基于TPU-NNTC和TPU-MLIR的模型编译与量化，基于BMRuntime的推理引擎移植，以及基于BMCV/OpenCV的前后处理算法移植。

SOPHONSDK是算能科技基于其自主研发的深度学习处理器所定制的深度学习SDK，涵盖了神经网络推理阶段所需的模型优化、高效运行时支持等能力，为深度学习应用开发和部署提供易用、高效的全栈式解决方案。目前可兼容BM1684/BM1684X/BM1688(CV186X)。

目录结构与说明

SOPHON-DEMO提供的例子从易到难分为tutorial、sample、application三个模块，tutorial模块存放一些基础接口的使用示例，sample模块存放一些经典算法在SOPHONSDK上的串行示例，application模块存放一些典型场景的典型应用。

tutorial	说明
resize	resize接口。针对图像做缩放操作
crop	crop接口，从输入图片中抠出需要用的图片区域
crop_and_resize_padding	将图片指定位置指定大小部分图片抠出，缩放后填充到大图中，空余部分填充指定像素数值
ocv_jpgbasic	使用sophon-opencv硬件加速实现图片编解码
ocv_vidbasic	使用sophon-opencv硬件加速实现视频解码，并将视频记录为png或jpg格式
blend	融合拼接两张图
stitch	拼接两张图片
avframe_ocv	avframe到cv::mat的转换例程
ocv_avframe	bgr mat到yuv420p avframe的转换例程
bm1688_2core2task_yolov5	使用bm1688的双核双任务推理部署的yolov5
mmap	mmap接口，映射TPU内存到CPU
video_encode	视频编码和推流

sample	算法类别	编程语言	BModel
LPRNet	车牌识别	C++/Python	FP32/FP16/INT8
ResNet	图像分类	C++/Python	FP32/FP16/INT8
RetinaFace	人脸检测	C++/Python	FP32/FP16/INT8
SCRFD	人脸检测	C++/Python	FP32/FP16/INT8
segformer	语义分割	C++/Python	FP32/FP16
SAM	语义分割	Python	FP32/FP16
yolact	实例分割	C++/Python	FP32/FP16/INT8
YOLOv8_seg	实例分割	C++/Python	FP32/FP16/INT8
YOLOv9_seg	实例分割	C++/Python	FP32/FP16/INT8
PP-OCR	OCR	C++/Python	FP32/FP16
OpenPose	人体关键点检测	C++/Python	FP32/FP16/INT8
C3D	视频动作识别	C++/Python	FP32/FP16/INT8
DeepSORT	多目标跟踪	C++/Python	FP32/FP16/INT8
ByteTrack	多目标跟踪	C++/Python	FP32/FP16/INT8
CenterNet	目标检测、姿态识别	C++/Python	FP32/FP16/INT8
YOLOv5	目标检测	C++/Python	FP32/FP16/INT8
YOLOv34	目标检测	C++/Python	FP32/INT8
YOLOX	目标检测	C++/Python	FP32/INT8
SSD	目标检测	C++/Python	FP32/INT8
YOLOv7	目标检测	C++/Python	FP32/FP16/INT8
YOLOv8_det	目标检测	C++/Python	FP32/FP16/INT8
YOLOv5_opt	目标检测	C++/Python	FP32/FP16/INT8
YOLOv5_fuse	目标检测	C++/Python	FP32/FP16/INT8
YOLOv9_det	目标检测	C++/Python	FP32/FP16/INT8
YOLOv10	目标检测	C++/Python	FP32/FP16/INT8
ppYOLOv3	目标检测	C++/Python	FP32/FP16/INT8
ppYoloe	目标检测	C++/Python	FP32/FP16
WeNet	语音识别	C++/Python	FP32/FP16
Whisper	语音识别	Python	FP16
Seamless	语音识别	Python	FP32/FP16
BERT	语言模型	C++/Python	FP32/FP16
ChatGLM2	语言模型	C++/Python	FP16/INT8/INT4
Llama2	语言模型	C++/Python	FP16/INT8/INT4
ChatGLM3	语言模型	Python	FP16/INT8/INT4
Qwen	语言模型	Python	FP16/INT8/INT4
Qwen1_5	语言模型	Python	FP16/INT8/INT4
MiniCPM	语言模型	C++	INT8/INT4
Baichuan2	语言模型	Python	INT8/INT4
ChatGLM4	语言模型	Python	INT8/INT4
StableDiffusionV1.5	图像生成	Python	FP32/FP16
StableDiffusionXL	图像生成	Python	FP32/FP16
GroundingDINO	多模态目标检测	Python	FP16
Real-ESRGAN	超分辨	C++/Python	FP32/FP16/INT8
P2PNet	人群计数	C++/Python	FP32/FP16/INT8
CLIP	图文生成	Python	FP16
SuperGlue	特征匹配	C++	FP32/FP16

application	应用场景	编程语言
VLPR	多路车牌检测+识别	C++/Python
YOLOv5_multi	多路目标检测	C++
YOLOv5_multi_QT	多路目标检测+QT_HDMI显示	C++

版本说明

版本	说明
0.2.3	完善和修复文档、代码问题，sample模块新增例程StableDiffusionXL、ChatGLM4、Seamless、YOLOv10，tutorial模块新增mmap、video_encode例程。
0.2.2	完善和修复文档、代码问题，部分例程补充CV186X支持，sample模块新增例程Whisper、Real-ESRGAN、SCRFD、P2PNet、MiniCPM、CLIP、SuperGlue、YOLOv5_fuse、YOLOv8_seg、YOLOv9_seg、Baichuan2等例程，tutorial模块新增avframe_ocv、ocv_avframe、bm1688_2core2task_yolov5例程。
0.2.1	完善和修复文档、代码问题，部分例程补充CV186X支持，YOLOv5适配SG2042，sample模块新增例程GroundingDINO、Qwen1_5，StableDiffusionV1_5新支持多种分辨率，Qwen、Llama2、ChatGLM3添加web和多会话模式。tutorial模块新增blend和stitch例程
0.2.0	完善和修复文档、代码问题，新增application和tutorial模块，新增例程ChatGLM3和Qwen，SAM添加web ui，BERT、ByteTrack、C3D适配BM1688，原YOLOv8更名为YOLOv8_det并且添加cpp后处理加速方法，优化常用例程的auto_test，更新TPU-MLIR安装方式为pip
0.1.10	修复文档、代码问题，新增ppYoloe、YOLOv8_seg、StableDiffusionV1.5、SAM，重构yolact，CenterNet、YOLOX、YOLOv8适配BM1688，YOLOv5、ResNet、PP-OCR、DeepSORT补充BM1688性能数据，WeNet提供C++交叉编译方法
0.1.9	修复文档、代码问题，新增segformer、YOLOv7、Llama2例程，重构YOLOv34，YOLOv5、ResNet、PP-OCR、DeepSORT、LPRNet、RetinaFace、YOLOv34、WeNet适配BM1688，OpenPose后处理加速，chatglm2添加编译方法和int8/int4量化。
0.1.8	完善修复文档、代码问题，新增BERT、ppYOLOv3、ChatGLM2，重构YOLOX，PP-OCR添加beam search，OpenPose添加tpu-kernel后处理加速，更新SFTP下载方式。
0.1.7	修复文档等问题，一些例程支持BM1684 mlir，重构PP-OCR、CenterNet例程，YOLOv5添加sail支持
0.1.6	修复文档等问题，新增ByteTrack、YOLOv5_opt、WeNet例程
0.1.5	修复文档等问题，新增DeepSORT例程，重构ResNet、LPRNet例程
0.1.4	修复文档等问题，新增C3D、YOLOv8例程
0.1.3	新增OpenPose例程，重构YOLOv5例程（包括适配arm PCIe、支持TPU-MLIR编译BM1684X模型、使用ffmpeg组件替换opencv解码等）
0.1.2	修复文档等问题，重构SSD相关例程，LPRNet/cpp/lprnet_bmcv使用ffmpeg组件替换opencv解码
0.1.1	修复文档等问题，使用BMNN相关类重构LPRNet/cpp/lprnet_bmcv
0.1.0	提供LPRNet等10个例程，适配BM1684X(x86 PCIe、SoC)，BM1684(x86 PCIe、SoC)

环境依赖

SOPHON-DEMO主要依赖TPU-MLIR、TPU-NNTC、LIBSOPHON、SOPHON-FFMPEG、SOPHON-OPENCV、SOPHON-SAIL，对于BM1684/BM1684X SOPHONSDK，其版本要求如下：

SOPHON-DEMO	TPU-MLIR	TPU-NNTC	LIBSOPHON	SOPHON-FFMPEG	SOPHON-OPENCV	SOPHON-SAIL	SOPHONSDK
0.2.3	>=1.8	>=3.1.7	>=0.5.0	>=0.7.3	>=0.7.3	>=3.7.0	>=v24.04.01
0.2.2	>=1.8	>=3.1.7	>=0.5.0	>=0.7.3	>=0.7.3	>=3.7.0	>=v23.10.01
0.2.1	>=1.7	>=3.1.7	>=0.5.0	>=0.7.3	>=0.7.3	>=3.7.0	>=v23.10.01
0.2.0	>=1.6	>=3.1.7	>=0.5.0	>=0.7.3	>=0.7.3	>=3.7.0	>=v23.10.01
0.1.10	>=1.2.2	>=3.1.7	>=0.4.6	>=0.6.0	>=0.6.0	>=3.7.0	>=v23.07.01
0.1.9	>=1.2.2	>=3.1.7	>=0.4.6	>=0.6.0	>=0.6.0	>=3.7.0	>=v23.07.01
0.1.8	>=1.2.2	>=3.1.7	>=0.4.6	>=0.6.0	>=0.6.0	>=3.6.0	>=v23.07.01
0.1.7	>=1.2.2	>=3.1.7	>=0.4.6	>=0.6.0	>=0.6.0	>=3.6.0	>=v23.07.01
0.1.6	>=0.9.9	>=3.1.7	>=0.4.6	>=0.6.0	>=0.6.0	>=3.4.0	>=v23.05.01
0.1.5	>=0.9.9	>=3.1.7	>=0.4.6	>=0.6.0	>=0.6.0	>=3.4.0	>=v23.03.01
0.1.4	>=0.7.1	>=3.1.5	>=0.4.4	>=0.5.1	>=0.5.1	>=3.3.0	>=v22.12.01
0.1.3	>=0.7.1	>=3.1.5	>=0.4.4	>=0.5.1	>=0.5.1	>=3.3.0	-
0.1.2	Not support	>=3.1.4	>=0.4.3	>=0.5.0	>=0.5.0	>=3.2.0	-
0.1.1	Not support	>=3.1.3	>=0.4.2	>=0.4.0	>=0.4.0	>=3.1.0	-
0.1.0	Not support	>=3.1.3	>=0.3.0	>=0.2.4	>=0.2.4	>=3.1.0	-

对于BM1688/CV186AH SOPHONSDK，其版本要求如下：

SOPHON-DEMO	TPU-MLIR	LIBSOPHON	SOPHON-FFMPEG	SOPHON-OPENCV	SOPHON-SAIL	SOPHONSDK
0.2.3	>=1.8	>=0.4.9	>=1.6.0	>=1.6.0	>=3.8.0	>=v1.7.0
0.2.2	>=1.8	>=0.4.9	>=1.6.0	>=1.6.0	>=3.8.0	>=v1.6.0
0.2.1	>=1.7	>=0.4.9	>=1.5.0	>=1.5.0	>=3.8.0	>=v1.5.0
0.2.0	>=1.6	>=0.4.9	>=1.5.0	>=1.5.0	>=3.7.0	>=v1.5.0

注意：

不同例程对版本的要求可能存在差异，具体以例程的README为准，可能需要安装其他第三方库。

BM1688/CV186X与BM1684X/BM1684对应的sdk不是同一套，在官网上已作区分，请注意。

技术资料

请通过算能官网技术资料获取相关文档、资料及视频教程。

社区

算能社区鼓励开发者多交流，共学习。开发者可以通过以下渠道进行交流和学习。

算能社区网站：https://www.sophgo.com/

算能开发者论坛：https://developer.sophgo.com/forum/index.html

贡献

欢迎参与贡献。更多详情，请参阅我们的贡献者Wiki。

许可证

Apache License 2.0

flyingcys/sophon-demo

SOPHON-DEMO介绍

简介

目录结构与说明

版本说明

环境依赖

技术资料

社区

贡献

许可证