版本: 0.3.1 ubuntu: 16.04 MATE
**研究生智慧城市技术挑战赛,视频类别90,训练集23000条左右视频,验证集4000左右条数据,测试集5600条左右数据 ,VGG16,在视频阵级别进行检测,本想使用双流网络,但是时间来不及了。只进行了RGB帧检测,测试结果,验证集top1,45左右,top3,80左右. 实际比赛中,该网络top5准确度,mAP为76
实际训练,NVIDIA 1080Ti * 4
epoch为1000左右,需要一天左右。
1.视频提取帧 2.VGG16网络 3.视频数据增强,图像随机反转,概率裁剪,转换tensor,正则化,
1.datasets文件夹包含数据处理的代码,视频转换 2.Models包含网络的模型代码 3.script包含了测试集的测试代码,并将预测的top5保存在json类型文件中 4.tstjson仅仅是我个人的测试,里面有关于接送文件的操作; 5.剩下的主文件夹下的文件是训练代码,如果配置好,处理好数据,修改下就可以直接执行了。