/MOT_MUST2

Code for Zhejiang Lab Cup AI Competition (second round) [Multiple Object (Pedestrian) Tracking]

Primary LanguageMATLAB

之江杯(复赛)---行人多目标跟踪方法运行代码 MUST


依赖项

 pip install -r requirements.txt

方案说明与算法原理

成绩运行时间说明
  • 目标检测:b1, b2, b3, b5(yolov3):共计约2h(1050Max-q, 16G)
  • 目标检测:b4(keypoints-Mask-R-CNN):约4h(1080Ti*1, 64G)
  • 基于检测结果输出跟踪提交结果:共计约5h(1080Ti*1, 64G)
行人跟踪算法原理描述
  1. 结合单目标跟踪算法及行人重识别算法,实现有效的多目标跟踪框架;
  2. 视频检测结果由YOLOv3及Keypoints Mask-R-CNN提供;
  3. 应用SiamsRPN跟踪算法,确保对单个行人目标在非特殊场景下(无遮挡、剧烈变形等)的稳定跟踪;
  4. 针对困难场景(遮挡、形变),使用ReID算法进行数据关联;

详情见YOLOv3、keypoints-Mask-R-CNN、SiamsRPN等参考文献内容。

行人跟踪算法原理图

Algorithm

数据和预训练权重保存

训练数据

本次比赛用到的数据集主要有两类,行人检测数据集citypersons(包含网上搜索自标注的50张图片)和行人重识别的cuhk数据集

使用方法:

将下载的文件夹放入相应的文件夹中,如citypersons连接中包含images的压缩包,可替代仓库中的data中的citypersons中的images文件夹,cuhk-np直接放入data中

链接如下:
预训练权重

预训练权重保存在weights目录下

训练

Yolo检测网络训练
 python3 detector/yolov3/train.py --multi-scale
ReID网络训练

ReID 部分我们使用了cuhk数据集,这个数据集有两个部分cuhk-labelled and cuhk-detected, 最后使用了cuhk-labelled的训练结果

for cuhk-labelled
python pysot/ReID/main.py -d cuhk -b 20 -j 4 --epochs 100 --log ./logs/cuhk_labeled/ --step-size 40 --data-dir data/cuhk03-np/labeled
for cuhk-detected
python pysot/ReID/main.py -d cuhk -b 20 -j 4 --epochs 100 --log ./logs/cuhk_detected/ --step-size 40 --data-dir data/cuhk03-np/detected
其他

本次比赛中,检测算法使用了YOLOv3keypoints-Mask-R-CNN两种方法。

其中,YOLOv3在COCO预训练的基础上进行了重新训练,keypoints-Mask-R-CNN直接使用了作者提供的预训练模型。

为了增强黑夜检测效果的性能,b4采用keypoints-Mask-R-CNN,其他视频检测应用YOLOv3。

目标检测,单帧图像生成及后处理

initialize.sh

目标跟踪

test.sh

提交结果

运行initialize.sh和test.sh后,提交结果保存至"./result/track"

特别说明

由于最后提交日时间问题,b3提交结果为level_1阶段应用提交的ECO跟踪算法。复赛的前几次结果也是应用ECO算法提交,即b3与9.12日提交结果一致

参考文献及程序来源

[1] https://github.com/STVIR/pysot

[2] Bo Li, Junjie Yan, Wei Wu, Zheng Zhu, Xiaolin Hu; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018, pp. 8971-8980

[3] Zhu, J., Yang, H., Liu, N., Kim, M., Zhang, W., Yang, M.: Online Multi-Object Tracking with Dual Matching Attention Networks. In: ECCV (2018)

[4] Redmon J , Farhadi A . YOLOv3: An Incremental Improvement. 2018.

[5] Wang H , Fan Y , Wang Z , et al. Parameter-Free Spatial Attention Network for Person Re-Identification[J]. 2018.

[6] https://github.com/chrispolo/Keypoints-of-humanpose-with-Mask-R-CNN

[7] https://github.com/ultralytics/yolov3

[8] Zhang, Shanshan, Rodrigo Benenson, and Bernt Schiele. "Citypersons: A diverse dataset for pedestrian detection." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017.