/YOLOv3_with_my_Dataset

采图片,标数据,训模型,调参炼丹。

Primary LanguagePythonGNU General Public License v3.0GPL-3.0

YOLOv3 训练自己的数据集

will add more soon!

作者:刘云飞

建议与合作联系邮箱:liuyunfei.1314@163.com

0x00 语言和工具

语言:Python 3.7

框架:PyTorch 1.2

标注工具:LabelImg

网络结构:Yolo v3

0x01 数据集及标注

标注4类:

card 、tools、mouse、starbucks

例:

数据集图

0x02 使用YOLOv3训练

Yolo 算是目前比较工程使用最多的算法之一了,无论是理解还是实现都比较简洁。

本例在右侧代码上修改而成,原始代码from: https://github.com/eriklindernoren/PyTorch-YOLOv3

论文的链接:https://arxiv.org/abs/1804.02767

Yolo v3 的推断时间,可以看下图,超越现有算法很多。

Yolo v3 的backbone使用自己的darknet53,实现上也很简洁,参考了Resnet的结构。

yolo v3 的整体结构( by Levio):

图片如下

yolo的输入尺寸为416x416,下采样5次,416/32=13,特征图为13x13.

加上中间层的直接输出,共3个尺度的信息13x13,26x26,52x52。目的是保证小尺寸目标的检测效果。

输出为(4+1+80)x3 x 13 x 13 (4+1+80)x3 x 26 x 26 (4+1+80)x3 x 52 x 52

4 指 box的坐标

1指确信度

80指80种类别(coco数据集)

3指3种anchor box的 尺度

0x03 效果

用摄像头跑,结果展示,FPS在17-21之间,达到了实时检测的效果。

视频 B站链接:https://www.bilibili.com/video/av76005760

图片如下:

图片如下