/vj-face

Viola Jones Object Detection Framework in C

Primary LanguageC

Viola jones face detection implementation

参考viola jones人脸识别的相关文章[1-3],实现了论文中提到的整个人脸识别框架。

本框架可用于人脸识别的训练和测试过程,具体用法如下。

说明

语言:c/c++
平台:macOS/linux/windows
环境:opencv4.2.0 + openmp
数据:训练集:2000张人脸 2721张非人脸 验证集:1000张人脸 601张非人脸 需要数据的可以留邮箱

参考文章

  1. An Analysis of the Viola-Jones Face Detection Algorithm

  2. Robust Real-Time Face Detection

  3. Rapid Object Detection using a Boosted Cascade of Simple Features

示例

daddrio

haarcascade框架使用说明

训练阶段

第一个参数: train,代表进行训练
第二个参数: 模型训练时用到的数据文件路径(下面有数据格式示例)
-model 模型配置文件路径,模型支持继续训练,如果需要在先前模型基础上继续训练,可给出先前模型文件路径(可选)

用法如下:

./haarcascade train ./train.data 

测试阶段

第一个参数: test,代表进行测试
第二个参数: 测试文件路径,一般为*.jpg, *.png, *.gif,当该参数名为“webcam”时,程序会打开0号摄像头并进行检测(如果有的话,并且编译时勾选了opencv)
-model 模型配置文件路径(可选,默认加载模型./backup/attentional_cascade_def.cfg)
-outfile 测试得到的文件保存路径,可通过opencv直接查看,编译时需配置opencv选项(可选)
-skintest 肤色测试开关,1打开 0关闭,测试彩色图像时可以打开,测试灰度图像时需要关闭,默认为关闭(可选)

一般图像测试:

 ./haarcascade test ./Users/bazinga/Desktop/daddario.jpg

打开摄像头:

./haarcascade test webcam -skintest 1

训练数据示例

window_size = 24  (检测窗大小,同样也是正样本的图片大小,必须是正方形)
train_positive = ./train_pos.list (./train_pos.list文件中包含了所有训练集中的正样本路径,列表形式)
train_negative = ./train_neg.list (./train_neg.list文件中包含了所有训练集中的负样本路径,列表形式)
validation_positive = ./vali_pos.list(./vali_pos.list文件中包含了所有验证集中的正样本路径,列表形式)
validation_negative = ./vali_neg.list(./vali_neg.list文件中包含了所有验证集中的负样本路径,列表形式)
backup = ./backup (模型训练时的保存路径)
fnr_perstage = 0.005  (单个阶段内的假阴性率训练目标)
fpr_perstage = 0.5   (单个阶段内的假阳性率训练目标)
fpr_overall = 0.0000001  (整体模型的假阳性率训练目标)

训练时用到的正负样本需为灰度图像,且每个正样本图像大小为 window_size x window_size像素,负样本图像大小可以不固定

不足之处

文章[1]中最终训练所得的模型有31层,在48G的linux系统下训练了一天左右。目前框架中使用的默认模型只有十层,在mac上训练了大概2小时左右,fpr还是有些高(10e-4左右),还需进一步训练。

文章[1]中分类器在图像上的步进为1个像素(与viola jones原文中有所不同,会产生更多的检测子窗),检测效率会有所下降,但可以获取更高的准确率。更改检测器的步进大小需要同时更改检测后处理过程。目前框架中实现了文章[1]中的后处理,但暂未应用。

可参考:Viola jones face detecion原理