/scenes-recognition

places-365 + 717attributions

Primary LanguagePython

数据集

场景类别训练使用place365数据集
场景属性使用SUN Attribute Database
官方输出场景类别与属性推断示例

模型

MobileNetV2

预训练模型
推断时间:233ms
模型大小:11.5M

输出

有两类输出:场景类别(365类)与场景属性(717种)
输出有两个全连接层,分别是场景类别置信度与场景属性分数
其中场景属性为多标签输出,分数阀值为1(我使用0.95),即分值大于阀值就可以认为输入具有该属性。

测试集准确率:

训练了60万ITER = 12epoch,测试准确率:
accuracy = 0.523699
accuracy_5 = 0.827315
loss = 1.79646 (* 1 = 1.79646 loss)
对比RESnet152 benchmark:the top1 accuracy is 54.74%(-2.37%) and the top5 accuracy is 84.98%(-2.25%).
训练完类别后再冻结卷积层训练属性

由于属性为多标签输出,而给的标注也较为主观,没法计算准确率,训练Loss值约为8,验证Loss值约为9.1