- History Of Object Recognition
- 过年回家详细阅读里面的内容
图像语义分割是一个从粗略到精细的过程
- 图像分类(Image Classification,图像中一个或多个实例分类)
- 对象定位(Object Localization)
- 对象识别(Object Recognition)
- 图像语义分割(Semantic Segmentation)
- 实例分割(Instance Segmentation,同一类中不同的实例分割)
- 关键点检测(Keypoint Detection)
- 缺少对不同特征的感知,阻碍了再具体问题和场景中的应用
- 由于固有的空间不变性,不能将全局的上下文信息考虑进去
- 不能感知实例
- 不能适应无结构的数据
- 需要大量的标签数据
- 像素级别的精度,即怎样处理局部信息
- 目标级别的分割,即怎样整合全局信息
-
解码变种:对低分辨率的特征图的处理不同
- 编码器:卷积网络
- 解码器:反卷积网络
-
整合上下文信息:整合不同空间尺度的信息,对局部信息和全局信息进行平衡
- 条件随机场:做为后期处理,组合低层次的像素级别的信息
- 膨胀卷积:膨胀卷积核获得更大的感受野(带孔卷积)
- 多尺度聚合:金字塔系列,将图像resize到多个尺度分别分割,最后整合分割结果
- 特征融合:提取不同层的特征进行融合,包含了不同的局部上下文信息
- 递归神经网络:
众所周知,图像语义分割需要获取上下文信息
帮助提高准确率。
-
不使用空洞卷积的传统卷积
通过下采样(pooling)
来增大感受野,以此获取上下文信息。- 卷积核的大小不变
- 减少了数据量
- 有利于防止过拟合
- 但是损失了分辨率,丢失了一些信息
-
空洞卷积
通过膨胀卷积核
来增大感受野,以此获取上下文信息。- 参数个数没有增加
- 数据量没有减少
- 分辨率没有损失
- 但是计算量增大,内存消耗增大