深度学习中图像增强是一种数据预处理技术,通过对原始图像进行一系列变换,增加数据的多样性,提高模型的泛化能力。
1. 基本几何变换
旋转 (Rotation):随机旋转图像一定角度。
作用:使模型对物体方向的变化更具鲁棒性。
平移 (Translation):沿水平方向或垂直方向平移图像。
作用:增强模型对位置变化的鲁棒性。
翻转 (Flip):水平或垂直翻转图像。
作用:增加数据的多样性,通常用于对象不变性,如人脸检测。
2. 缩放和裁剪
缩放 (Scaling):对图像进行放大或缩小。
作用:使模型适应不同大小的对象。
随机裁剪 (Random Crop):随机裁剪图像的一部分。
作用:提高模型对部分遮挡的鲁棒性。
3. 色彩变换
颜色抖动 (Color Jitter):随机改变图像的亮度、对比度、饱和度和色调。
作用:增强模型对不同光照条件和颜色变化的鲁棒性。
灰度化 (Grayscale):将图像转为灰度图。
作用:增加数据的多样性,特别是用于物体在不同光照下的识别。
4. 噪声和模糊
添加噪声 (Add Noise):在图像中添加随机噪声,如高斯噪声。
作用:提高模型对噪声的鲁棒性,使其在实际应用中表现更好。
模糊 (Blurring):对图像应用模糊滤波器,如高斯模糊。
作用:模拟不同的摄像头质量,提高模型对模糊图像的鲁棒性。
5. 仿射变换和透视变换
仿射变换 (Affine Transformation):包括旋转、平移、缩放、剪切等。
作用:增强模型对复杂变换的鲁棒性。
透视变换 (Perspective Transformation):对图像进行透视变换。
作用:模拟不同的视角和拍摄条件,使模型更具泛化能力。
6. 特殊增强
剪切 (Shear):将图像沿某个方向进行剪切。
作用:增加图像的多样性,提高模型对不同角度的鲁棒性。
填充 (Padding):在图像边缘添加填充。
作用:改变图像的边界条件,提高模型对图像边缘信息的鲁棒性。
7. 高级增强技术
混合增强 (Mixup):将两张图像按一定比例进行线性组合,同时混合其标签。
作用:生成更多样的训练样本,提高模型的泛化能力。
Cutout:在图像中随机遮挡一个矩形区域。
作用:使模型更关注图像的全局信息,而不是某些局部特征。
CutMix:将一张图像的某一部分替换为另一张图像的对应部分,并混合其标签。
作用:结合了Cutout和Mixup的优点,提高模型的鲁棒性和泛化能力。
版权声明:本文为CSDN博主 [SEU-WYL] 的原创文章,
遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/weixin_42605076/article/details/139215418