data augmentation 数据增强方法总结

来源:互联网 发布:中越海警船 知乎 编辑:程序博客网 时间:2024/05/17 06:52

1、问题描述

收集数据准备微调深度学习模型时,经常会遇到某些分类数据严重不足的情况,另外数据集过小容易造成模型的过拟合。

本文参考一些网友对于数据增强方法的一些tips,后续会附上自己实现的C++代码;


2、data augmentation常用方法

  • Color Jittering:对颜色的数据增强:图像亮度、饱和度、对比度变化(此处对色彩抖动的理解不知是否得当);
  • PCA  Jittering:首先按照RGB三个颜色通道计算均值和标准差,再在整个训练集上计算协方差矩阵,进行特征分解,得到特征向量和特征值,用来做PCA Jittering;
  • Random Scale:尺度变换;
  • Random Crop:采用随机图像差值方式,对图像进行裁剪、缩放;包括Scale Jittering方法(VGG及ResNet模型使用)或者尺度和长宽比增强变换;
  • Horizontal/Vertical Flip:水平/垂直翻转;
  • Shift:平移变换;
  • Rotation/Reflection:旋转/仿射变换;
  • Noise:高斯噪声、模糊处理;
  • Label shuffle:类别不平衡数据的增广,参见海康威视ILSVRC2016的report;另外,文中提出了一种Supervised Data Augmentation方法,有兴趣的朋友的可以动手实验下。

参考:

海康威视研究院ImageNet2016竞赛使用的数据增强方法;

知乎小白在闭关对数据增强的理解;

深度学习之图像的数据增强;

0 0
原创粉丝点击