百度爬虫

python baidu_spider.py

谷歌爬虫

注意谷歌爬虫需要翻墙
python google_spider.py

搜狗爬虫

python sougou_spider.py

图片预处理

python img_process.py

图像标注

这里推荐使用图像标注工具精灵标注助手 标注效果如下图所示:
avatar

  • 标注步骤:
    1. 创建工程,如图所示:
      avatar
    2. 分别进行标注
  • 工程导出
    1. 点击导出即可,注意必须分别保存成XML,pasca-voc两种格式, 其中XML格式用于导入使用,pasca-voc格式是我们训练模型正式使用的格式,如图所示: avatar
  • 工程导入
    1. 点击导入即可,导入刚才生成的XML格式数据即可,之前没有标注完可以接着标注。如图所示: avatar
  • 标注结果示例
    参见data/result/sougou_treeman_result/annotation_with_color_but_grey