深度学习中图像增强类别和作用

demi 在周四, 04/03/2025 - 09:37 提交

深度学习中图像增强是一种数据预处理技术，通过对原始图像进行一系列变换，增加数据的多样性，提高模型的泛化能力。

1. 基本几何变换

旋转 (Rotation)：随机旋转图像一定角度。

作用：使模型对物体方向的变化更具鲁棒性。

平移 (Translation)：沿水平方向或垂直方向平移图像。

作用：增强模型对位置变化的鲁棒性。

翻转 (Flip)：水平或垂直翻转图像。

作用：增加数据的多样性，通常用于对象不变性，如人脸检测。

2. 缩放和裁剪

缩放 (Scaling)：对图像进行放大或缩小。

作用：使模型适应不同大小的对象。

随机裁剪 (Random Crop)：随机裁剪图像的一部分。

作用：提高模型对部分遮挡的鲁棒性。

3. 色彩变换

颜色抖动 (Color Jitter)：随机改变图像的亮度、对比度、饱和度和色调。

作用：增强模型对不同光照条件和颜色变化的鲁棒性。

灰度化 (Grayscale)：将图像转为灰度图。

作用：增加数据的多样性，特别是用于物体在不同光照下的识别。

4. 噪声和模糊

添加噪声 (Add Noise)：在图像中添加随机噪声，如高斯噪声。

作用：提高模型对噪声的鲁棒性，使其在实际应用中表现更好。

模糊 (Blurring)：对图像应用模糊滤波器，如高斯模糊。

作用：模拟不同的摄像头质量，提高模型对模糊图像的鲁棒性。

5. 仿射变换和透视变换

仿射变换 (Affine Transformation)：包括旋转、平移、缩放、剪切等。

作用：增强模型对复杂变换的鲁棒性。

透视变换 (Perspective Transformation)：对图像进行透视变换。

作用：模拟不同的视角和拍摄条件，使模型更具泛化能力。

6. 特殊增强

剪切 (Shear)：将图像沿某个方向进行剪切。

作用：增加图像的多样性，提高模型对不同角度的鲁棒性。

填充 (Padding)：在图像边缘添加填充。

作用：改变图像的边界条件，提高模型对图像边缘信息的鲁棒性。

7. 高级增强技术

混合增强 (Mixup)：将两张图像按一定比例进行线性组合，同时混合其标签。

作用：生成更多样的训练样本，提高模型的泛化能力。

Cutout：在图像中随机遮挡一个矩形区域。

作用：使模型更关注图像的全局信息，而不是某些局部特征。

CutMix：将一张图像的某一部分替换为另一张图像的对应部分，并混合其标签。

作用：结合了Cutout和Mixup的优点，提高模型的鲁棒性和泛化能力。

版权声明：本文为CSDN博主 [SEU-WYL] 的原创文章，
遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。
原文链接：https://blog.csdn.net/weixin_42605076/article/details/139215418

简单易懂的讲解深度学习（入门系列之七）	深度学习中 FNN、CNN 与 RNN：异同剖析	打开AI的黑匣子：“可解释的”人工智能（XAI）认知攻略！
人人都能看得懂的深度学习介绍！全篇没有一个数学符号！	一文读懂：大数据、人工智能、机器学习与深度学习，解决你的学习烦恼！	Forbes \| 未来10年的10项人工智能预测

最新文章