这是kaggle 2017年的竞赛,分类SAR图像中的是冰山还是船。
漂浮的冰山给加拿大东岸海域等地区的航行和活动带来威胁。 目前,许多机构和公司使用空中侦察和岸基支持来监测环境条件并评估冰山的风险。但是,在天气特别恶劣的偏远地区,这些方法是不可行的,唯一可行的监测方法是通过卫星。 在本次比赛中,您面临的挑战是建立一种算法,自动识别遥感目标是船还是冰山。所做的改进将有助于降低维护安全工作条件的成本。
用于探测冰山的遥感系统位于地球上空600多公里的卫星上。哨兵1号卫星用于监测陆地和海洋。卫星每天绕轨14次拍摄地球表面给定瞬间、给定位置的图像。 C波段雷达可以穿透黑暗,雨水,云雾。由于它它是主动雷达,因此可以在白天或黑夜捕捉图像。
卫星雷达的工作方式与船舶或飞机雷达的工作方式大致相同。它捕捉都对象的反射信号,然后将信号转换为图像。物体反射的雷达能量比周围的环境多,因此在图像中,物体会成为一个亮点,但亮点可以是岛屿,海冰,以及冰山和船只。
当雷达探测到一个物体时,它不能识别是船只或冰山。我们需要分析反射信号的特征、形状、大小和亮度来识别物体。物体周围的背景(例如海洋),会受到许多因素的影响,强风会产生更明亮的背景,相反,低风会产生较暗的背景。哨兵-1号卫星是侧视雷达,这意味着它以一个角度(入射角)看到图像区域。一般来说,在较高的入射角度下,海洋背景会较暗。您还需要考虑雷达极化,雷达如何传输和接收能量。更先进的雷达如Sentinel-1可以在水平和垂直平面上传输和接收。使用这个,你可以得到所谓的双偏振图像。
对于本次比赛,将会有两个通道的数据:HH(水平发送/接收)和HV(水平发送和垂直接收)。
这应该算是领域性比较强的一个简介了。看到这个比赛的第一眼,我就想能把它当成一个普通的图像分类任务吗? 给的数据是这样的:
由于只有两个通道的数据,如何把它处理成一个三维的数据呢?可能第一想法就是把它相加平均。后来众多kernels证明,相加就能获得比较好的结果。
在开始这个实验前,我一直使用的是caffe,由于实验室等原因,我开始尝试使用keras。不得不说,keras使用起来很顺手。 用了k fold的交叉验证,训练集分为10份,每次留一份作为验证及,最终得到10个模型。用10个模型分别对测试集处理得到10个测试文件。然后,取10个文件的平均作为提交结果。
这个竞赛赛后的1st place的队伍说,data是leaky的。