AIliuys

语义分割部分代码备忘

数据集准备
- 数据集准备都是在线下Linux后台完成
- 在处理训练数据时和校验数据集时
  - 训练集中以下图片和相应的标定图片，图片size小于244x224做丢弃处理:
    2007_002273.jpg, 2008_004055.jpg, 2008_005294.jpg, 2009_000720.jpg, 2009_001898.jpg, 2009_004626.jpg, 2009_005055.jpg, 2010_002935.jpg
  - 校验集中以下图片size小于244x224做丢弃处理:
    2007_003848.jpg, 2007_004468.jpg, 2007_008802.jpg, 2007_009096.jpg, 2008_000666.jpg, 2008_000673.jpg, 2008_003108.jpg, 2008_004175.jpg, 2009_000487.jpg, 2010_000216.jpg, 2010_002939.jpg, 2010_005187.jpg, 2011_001722.jpg
- 数据集处理生成文件fcn_train.record,fcn_val.record
- 在vgg-16代码基础上
  - 添加了8s节点处网络的导出代码，以获取8s特征图8s特征图
  - 将原本16s节点处，反向卷积后并联后做的16被反向卷积修改为步长为2的卷积，即特征图会扩大2x2倍
  - 在8s处，将原有8s节点处的特征图和上述两次反卷积后得到的8s大小的特征图拼接后，再次进行步长为8的反向卷积，特征图总共扩大2x2x8倍，即达到和原图同样大小。
训练过程
- 原batchsize为16，但是运行时系统内存不足，所以缩减2倍取batchsize为8，所以训练时的step也相应的增加2倍，即batchsize=8，maxstep= 3000
结果输出
- 运行开始后，会在400step后，每隔200个step输出模型对校验集的校验结果
- 其中参考val_3000_prediction.jpg，可以看出对标定的动物有明显的紫色标记，同时可以看出在原图车轮胎和左上角天空处，有其他颜色的标记，虽然目前看来没有明显的准确意义，这个应该是模型对其他物体的识别
- 其中的val_3000_prediction_crfed.jpg，物品分割框架经过CRF后期处理后的结果，可以明显的看出对标定物体的分割形状
- 观察运行过程中的loss分布，损失一直处于在抖动中下降的趋势，所以认为模型的准确率尚未达到上限，经过更多次的训练，应该可以获得更好的结果

liuysong/segmentation

AIliuys

语义分割部分代码备忘