一、数据增强
当你训练一个机器学习模型时,你实际做工作的是调参,以便将特定的输入(一副图像)映像到输出(标签)。我们优化的目标是使模型的损失最小化 , 以正确的方式调节优化参数即可实现这一目标[参考][参考]。
人工智能的核心是机器学习,深度学习需要大量的数据,那么当数据有限是如何进行深度学习?
1.1 常用的增强技术
每个技术都定义了一个增强因子,用以增强数据集(也成为数据增强因子)
1、翻转
2、旋转
关于这个操作,需要注意的一个关键问题是,在旋转之后,图像维度可能不会被保留。如果是正方型图像,旋转90度之后图像的尺寸会被保存。如果图像是长方形,旋转180度之后图像尺寸也会保存。 但用更小的角度旋转图像,将会改变最终图像的尺寸。在下面的章节中我们将会看到如何解决这个问题。下面是方形图像旋转90度的例子。
3、缩放
放大时,放大后的图像尺寸会大于原始尺寸。大多数图像处理架构会按照原始尺寸对放大后的图像进行裁切。
4、裁剪
5、平移
平移是将图像沿X或Y方向(或者同时沿2个方向)移动。在下面的例子中, 我们假设在图像边界之外是黑色的背景,也同步被移动。这一数据增强方法非常有用,因为大多数对象有可能分布在图像的任何地方。这迫使你的卷积神经网络需要看到所有地方。
- 高斯噪声
通过添加适量的噪声能够有效提升神经网络的学习能力。
一个"弱化"的版本是椒盐噪声,它以随机的白色和黑色像素点呈现并铺满整个图片。这种方式对图像产生的作用和添加高斯噪声产生的作用是一样的,只是效果相对较弱。
- 颜色变换类,指通过模糊、颜色变换、擦除、填充等方式对图像进行处理
1.2 高级增强技术
- 条件型生成对抗网络(Conditional GANs)将夏日风光的图片转换为冬季风景的例子(风格迁移)