Data Augmentation

来源：互联网发布：山人太极服淘宝编辑：程序博客网时间：2024/05/22 14:30

之前刘青山院长请了华南理工大学的教授来做报告，他们做的手写字体识别，人脸打分和手势识别的demo的确很不错。

他也坦言说之前的传统方法确实没法和CNN比，deep效果就是好，我曾多次听到他强调他对数据Data Augmentation的好处。

在论文《ImageNet Classification with Deep Convolutional Neural Networks》

用了两种方法：

随机crop。训练时候，对于256＊256的图片进行随机crop到224＊224，然后允许水平翻转，那么相当与将样本倍增到((256-224)^2)*2=2048。测试时候，对左上、右上、左下、右下、中间做了5次crop，然后翻转，共10个crop，之后对结果求平均。作者做，不做随机crop，大网络基本都过拟合(under substantial overfitting)。
对RGB空间做PCA，然后对主成分做一个(0, 0.1)的高斯扰动。结果让错误率又下降了百分一。

而在fast-rcnn中

作者只用了水平翻转这一个方法。

0 0