背景
深度学习三把斧第一把: "数据增广"
博客地址: 目标检测系列二:数据增广
本部分代码: image_aug_for_detection
version 0.1.0
第一次提交版本,涵盖图像长宽变化的增广方式以及不改变图像长宽的方式.
PIL
,opencv
,skimage
数据扩充按照是否改变图像尺寸分为两大类 keep_size 和 change_size,
keep_size支持的数据扩充方式:
- 图像色彩平衡调节:PIL.ImageEnhance.Color()
- 图像对比度调节:PIL.ImageEnhance.Contrast()
- 图像亮度调节:PIL.ImageEnhance.Brightness()
- 图像加噪声:通过skimage.util.random_noise()实现,支持:高斯噪声、盐/椒噪声、泊松噪声、乘法噪声
- 图像模糊:PIL.ImageFilter
change_size支持的数据扩充方式:
- 旋转:选择0-360度范围内的旋转
- 翻转:水平翻转,垂直翻转
- 缩放:按照一定比例缩放图片
Step 1: 准备 csv 格式的标注文件 train_labels.csv
,样例如下
/mfs/home/zhuchaojie/ds/data/000.jpg,145,245,324,654,helmet
Step 2: 修改 config.py
相关配置,解释如下
class DefaultConfigs(object):
raw_images = "./data/raw/images/" # 原始图片路径
raw_csv_files = "./data/raw/csv_files/train_labels.csv" # 原始csv格式标签
augmented_images = "./data/augmented/images/" # 增强后的图片保存路径
augmented_csv_file = "./data/augmented/csv_files/augmented_labels.csv" # 增强后的csv格式的标注文件
image_format = "jpg" # 默认图片格式
config = DefaultConfigs()
Step 3: 执行 python example.py
温馨提示: 记得将扩充的数据和原始数据合并后再转换格式
详情移步: 目标检测系列一:如何制作数据集?
说明:由于csv,txt格式过于简单,不提供转换脚本,直接使用 python open就可以完成.
目前支持的格式转换:
- csv to coco2017
- csv to voc2007
- labelme to coco2017
- labelme to voc2007
- txt to coco2017
- 替换增强方式为
imgaug
下的,支持更多种类的数据扩充 - 暂时没其他需要,没考虑那么多,有需求提
issue
就行. - 下一篇:通过实例掌握目标检测