/tianchi

天池大数据竞赛《广东省政务数据创新大赛——智能算法赛》 数据切分

Primary LanguagePython

天池大数据竞赛《广东省政务数据创新大赛——智能算法赛》 数据切分

xjtudlc小组。获极客奖(第13名)

代码主要为数据预处理部分。

未上传项目中生成文件夹与源数据部分(上传文件过大)。

运行

  1. 运行 cut_roi2.py 生成2017文件夹里 类似 2015_0_0_256.jpg 2017_0_0_256.jpg 所有切分数据

  2. 运行 dataAnnotation2.py 进行数据标记,同一幅数据标注时,左键点选标注多边形,一个多边形画好后,按s保存,继续寻找下一个多边形,s保存。该幅图标注完成后,按n进入下一幅图的标注。

标注

  1. 正样本:在2015年没有地上建筑物,然而到2017年新建了建筑物。

  2. 负样本:所有其它情况(包括无变化、地上建筑物拆除、道路兴建等等)。

发现

  1. 正样本很少出现在密集型房区
  2. 正样本很少出现在田地中,田中的特别小的房子,覆盖正片田的白膜都不算作正样本
  3. 正样本极大概率出现在2015年的黄土地上
  4. 碰到新建的连排房(类似于社区)这种,如果规模大、间隔小的直接整块标,规模小、间隔大的需要分开标
  5. 只是房顶换了一种颜色的不算正样本
  6. 官方负样本集中在密集型房区。