will add more soon!
作者:刘云飞
建议与合作联系邮箱:liuyunfei.1314@163.com
语言:Python 3.7
框架:PyTorch 1.2
标注工具:LabelImg
网络结构:Yolo v3
标注4类:
card 、tools、mouse、starbucks
例:
Yolo 算是目前比较工程使用最多的算法之一了,无论是理解还是实现都比较简洁。
本例在右侧代码上修改而成,原始代码from: https://github.com/eriklindernoren/PyTorch-YOLOv3
论文的链接:https://arxiv.org/abs/1804.02767
Yolo v3 的推断时间,可以看下图,超越现有算法很多。
Yolo v3 的backbone使用自己的darknet53,实现上也很简洁,参考了Resnet的结构。
yolo v3 的整体结构( by Levio):
yolo的输入尺寸为416x416,下采样5次,416/32=13,特征图为13x13.
加上中间层的直接输出,共3个尺度的信息13x13,26x26,52x52。目的是保证小尺寸目标的检测效果。
输出为(4+1+80)x3 x 13 x 13 (4+1+80)x3 x 26 x 26 (4+1+80)x3 x 52 x 52
4 指 box的坐标
1指确信度
80指80种类别(coco数据集)
3指3种anchor box的 尺度
用摄像头跑,结果展示,FPS在17-21之间,达到了实时检测的效果。
视频 B站链接:https://www.bilibili.com/video/av76005760
图片如下: