/FaceMaskDetection

开源人脸口罩检测模型和数据 Detect faces and determine whether people are wearing mask.

Primary LanguagePythonMIT LicenseMIT

FaceMaskDetection

[updates]

人脸口罩检测,现开源所有主流框架模型和推理代码,支持的框架如下:

  • PyTorch
  • TensorFlow(包含tflite模型和pb模型)
  • Keras
  • MXNet
  • Caffe

检测人脸并判断是否佩戴了口罩, 并开源近8000张人脸口罩标注数据

Detect faces and determine whether they are wearing mask.

首先,祝愿我国和世界各国早日战胜新冠肺炎疫情,武汉加油!**加油!

  • 我们开源了人脸口罩检测的所有主流框架(PyTorch、TensorFlow、Keras、MXNet和caffe)(使用keras训练的模型,并转换得到的其他框架模型),并提供了所有五大框架的的运行代码(训练代码我们整理好后会立即开源)。所有模型都在models文件夹下。

  • 开源了标注的7959张人脸标注图片,数据集来自于WIDER FaceMAFA数据集, 我们重新修改了标注并进行了校验(主要是 MAFA和WIDER Face的人脸位置定义不一样,所以我们进行了修改标注)并将其开源出来。(有需要的朋友,敬请关注我们新建的公众号AIZOO(本文末也有二维码,可以扫描关注),回复口罩数据集就可以了。公众号刚开,恳请大家帮忙关注和扩散一下~)

模型结构

我们在本项目中使用了SSD类型的架构,为了让模型可以实时的跑在浏览器以及终端设备上,我们将模型设计的非常小,只有101.5万个参数。模型结构在本文附录部分。

本模型输入大小为260x260,主干网络只有8个卷积层,加上定位和分类层,一共只有24层(每层的通道数目基本都是32\64\128),所以模型特别小,只有101.5万参数。模型对于普通人脸基本都能检测出来,但是对于小人脸,检测效果肯定不如大模型。具体效果,大家可以点击以下链接,访问我们的网站在线体验效果。 aizoo.com跑在您浏览器的口罩检测模型

网页使用了Tensorflow.js库,所以模型是完全运行在您浏览器里面的。运行速度的快慢,取决于您电脑配置的高低。

模型在五个卷积层上接出来了定位分类层,其大小和anchor设置信息如下表.

卷积层 特征图大小 anchor大小 anchor宽高比(aspect ratio)
第一层 33x33 0.04,0.056 1,0.62,0.42
第二层 17x17 0.08,0.11 1,0.62,0.42
第三层 9x9 0.16,0.22 1,0.62,0.42
第四层 5x5 0.32,0.45 1,0.62,0.42
第五层 3x3 0.64,0.72 1,0.62,0.42

运行方法

pytorch

如果您要运行图片:

python pytorch_infer.py  --img-path /path/to/your/img

如果您要在视频上跑,只需要:

python pytorch_infer.py --img-mode 0 --video-path /path/to/video  
# 如果要打开本地摄像头, video_path填写0就可以了,如下
python pytorch_infer.py --img-mode 0 --video-path 0

TensorFlow/Keras/MXNet/Caffe

另外四大框架运行方法基本类似,只不过将pytorch_infer.pypytorch的换成对应框架名字即可即可,以TensorFlow为例:

python tensorflow_infer.py  --img-path /path/to/your/img

注意,对于caffe的推理,我们使用了permute层,所以需要使用caffe-ssd,也就是SSD作者开源的caffe版本,官方版本的caffe并不包含permute层。您也可以使用opencv的dnn模块来加载模型推理,opencv支持permute层。

不过如果您需要可以在官方版本的caffe上可以运行的模型,也可以联系我们修改模型,实现不需要permute层的模型。

附录

问题反馈与交流

欢迎AI圈和科技圈的朋友关注我们的公众号,这是我们分享AI技术和资讯的地方。我们要做的事情是搭建开发者和AI算法和产品需求方的一个桥梁,欢迎有AI算法需求的朋友关注我们,也欢迎有熟练算法和开发经验的工程师添加我们,与我们交流。

如果你有任何问题,欢迎关注我们的公众号,通过后台给我留言,或者添加作者元峰的微信AIZOOTech与我联系 ,我会将您拉入AIZOO技术交流群。 我们的技术交流群二维码,欢迎算法开发者和需求方进群交流,请输入备注,例如张三丰-浙大-目标检测或者张三丰-腾讯-图像分割

模型结构图

为了可视化方便,我们省略了BN层,如果您要查看完整模型,可以查看img文件夹的face_mask_detection.hdf5.png图片

测试集PR曲线

因为WIDER face是一个任务比较复杂的数据集,我们的模型又设计的非常小,所以对于人脸的PR曲线并不是那么性感。这点可以通过设计大模型来提升对于小人脸的检测效果,如果您有需求,欢迎通过上述二维码联系我们。

我们的网页长这样

欢迎大家点击链接在线体验

aizoo.com跑在您浏览器的口罩检测模型