深度学习中图像增强类别和作用

深度学习中图像增强是一种数据预处理技术,通过对原始图像进行一系列变换,增加数据的多样性,提高模型的泛化能力。

1. 基本几何变换

旋转 (Rotation):随机旋转图像一定角度。

作用:使模型对物体方向的变化更具鲁棒性。

平移 (Translation):沿水平方向或垂直方向平移图像。

作用:增强模型对位置变化的鲁棒性。

翻转 (Flip):水平或垂直翻转图像。

作用:增加数据的多样性,通常用于对象不变性,如人脸检测。


2. 缩放和裁剪

缩放 (Scaling):对图像进行放大或缩小。

作用:使模型适应不同大小的对象。

随机裁剪 (Random Crop):随机裁剪图像的一部分。

作用:提高模型对部分遮挡的鲁棒性。


3. 色彩变换

颜色抖动 (Color Jitter):随机改变图像的亮度、对比度、饱和度和色调。

作用:增强模型对不同光照条件和颜色变化的鲁棒性。

灰度化 (Grayscale):将图像转为灰度图。

作用:增加数据的多样性,特别是用于物体在不同光照下的识别。


4. 噪声和模糊

添加噪声 (Add Noise):在图像中添加随机噪声,如高斯噪声。

作用:提高模型对噪声的鲁棒性,使其在实际应用中表现更好。

模糊 (Blurring):对图像应用模糊滤波器,如高斯模糊。

作用:模拟不同的摄像头质量,提高模型对模糊图像的鲁棒性。


5. 仿射变换和透视变换

仿射变换 (Affine Transformation):包括旋转、平移、缩放、剪切等。

作用:增强模型对复杂变换的鲁棒性。

透视变换 (Perspective Transformation):对图像进行透视变换。

作用:模拟不同的视角和拍摄条件,使模型更具泛化能力。


6. 特殊增强

剪切 (Shear):将图像沿某个方向进行剪切。

作用:增加图像的多样性,提高模型对不同角度的鲁棒性。

填充 (Padding):在图像边缘添加填充。

作用:改变图像的边界条件,提高模型对图像边缘信息的鲁棒性。


7. 高级增强技术

混合增强 (Mixup):将两张图像按一定比例进行线性组合,同时混合其标签。

作用:生成更多样的训练样本,提高模型的泛化能力。

Cutout:在图像中随机遮挡一个矩形区域。

作用:使模型更关注图像的全局信息,而不是某些局部特征。

CutMix:将一张图像的某一部分替换为另一张图像的对应部分,并混合其标签。

作用:结合了Cutout和Mixup的优点,提高模型的鲁棒性和泛化能力。


版权声明:本文为CSDN博主 [SEU-WYL] 的原创文章,
遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

原文链接:https://blog.csdn.net/weixin_42605076/article/details/139215418

最新文章