图片的数据增强(Data Augmentation)方法

在深度学习中,为了避免出现过拟合(Overfitting),通常我们需要输入充足的数据量.若数据量比较小,可以对原有的图像数据进行几何变换,改变图像像素的位置并保证特征不变。

旋转 | 反射变换(Rotation/reflection):

随机旋转图像一定角度;改变图像内容的朝向;

翻转变换(flip):

沿着水平或者垂直方向翻转图像;

缩放变换(zoom):

按照一定的比例放大或者缩小图像;

平移变换(shift):

在图像平面上对图像以一定方式进行平移;可以采用随机或人为定义的方式指定平移范围和平移步长,沿水平或竖直方向进行平移。改变图像内容的位置;

尺度变换(scale):

对图像按照指定的尺度因子, 进行放大或缩小; 或者参照SIFT特征提取思想, 利用指定的尺度因子对图像滤波构造尺度空间. 改变图像内容的大小或模糊程度;

对比度变换(contrast):

在图像的HSV颜色空间,改变饱和度S和V亮度分量,保持色调H不变。对每个像素的S和V分量进行指数运算(指数因子在0.25到4之间),增加光照变化;

噪声扰动(noise):

对图像的每个像素RGB进行随机扰动,常用的噪声模式是椒盐噪声和高斯噪声;

颜色变换(color):

在训练集像素值的RGB颜色空间进行PCA,得到RGB空间的3个主方向向量,3个特征值, p1, p2, p3, λ1, λ2, λ3.

来源:CSDN,作者:Yaphat,转载此文目的在于传递更多信息,版权归原作者所有。
原文:https://blog.csdn.net/yaphat/article/details/54098867
版权声明:本文为博主原创文章,转载请附上博文链接!

推荐阅读