数据增强(Data Augmentation)策略大全

图像数据增强方法

几何变换

  • 旋转:随机旋转图像一定角度(如±30°)。
  • 翻转:水平或垂直翻转图像。
  • 缩放:随机放大或缩小图像区域。
  • 裁剪:随机裁剪图像的一部分并调整至原尺寸。
  • 平移:沿x或y轴方向平移图像。

颜色空间变换

  • 亮度调整:随机改变图像亮度。
  • 对比度调整:调整图像对比度。
  • 饱和度调整:修改色彩饱和度。
  • 添加噪声:高斯噪声、椒盐噪声等。
  • 颜色抖动:随机调整RGB通道值。

高级增强技术

  • Mixup:混合两张图像及其标签(λ∈[0,1])。
  • Cutout:随机遮挡图像部分区域。
  • CutMix:用另一张图像的部分区域替换当前图像。
  • RandAugment:自动化选择增强策略的组合。

文本数据增强方法

词汇替换

  • 同义词替换:使用WordNet或预训练词向量替换单词。
  • 随机插入:在句子中随机插入同义词。
  • 随机交换:交换相邻词汇顺序。
  • 随机删除:以概率删除某些词汇。

语法变换

  • 回译:通过翻译至其他语言再译回原语言。
  • 句子重组:利用依存分析树调整句式结构。

生成模型

  • GPT-3等模型生成语义相似的句子。
  • 变分自编码器(VAE)生成新文本样本。

音频数据增强方法

时域增强

  • 变速:调整音频播放速度(保持音高)。
  • 时移:前后移动音频片段。
  • 裁剪:截取部分音频并填充至原长度。

频域增强

  • 添加噪声:白噪声、环境噪声等。
  • 音高变换:改变音频频率成分。

高级方法

  • SpecAugment:对频谱图进行时间/频率维度的遮挡。

视频数据增强方法

帧级增强

  • 对每一帧应用图像增强技术(如旋转、裁剪)。

时序增强

  • 帧采样:随机跳过或重复部分帧。
  • 时序裁剪:截取视频片段并调整至原长度。

空间-时序增强

  • 3D Cutout:在视频立方体(长×宽×时间)中随机遮挡。

通用注意事项

  • 增强后的数据需保持标签有效性(如翻转后的"6"可能变成"9")。
  • 避免过度增强导致模型学习到虚假模式。
  • 结合任务特性选择策略(如医学影像需谨慎几何变换)。

代码示例(图像旋转):

python 复制代码
from PIL import Image
import random

def rotate_image(image, max_angle=30):
    angle = random.uniform(-max_angle, max_angle)
    return image.rotate(angle)

公式示例(Mixup):

新样本生成公式:

x' = λx_i + (1-λ)x_j, \\quad y' = λy_i + (1-λ)y_j

其中 ( λ \sim Beta(α,α) ),通常 ( α=0.4 )。

相关推荐
ar012319 小时前
AR远程协助作用
人工智能·ar
北京青翼科技19 小时前
PCIe接口-高速模拟采集—高性能计算卡-青翼科技高品质军工级数据采集板-打造专业工业核心板
图像处理·人工智能·fpga开发·信号处理·智能硬件
软件聚导航19 小时前
马年、我用AI写了个“打工了马” 小程序
人工智能·ui·微信小程序
陈天伟教授20 小时前
人工智能应用-机器听觉:7. 统计合成法
人工智能·语音识别
笨蛋不要掉眼泪21 小时前
Spring Boot集成LangChain4j:与大模型对话的极速入门
java·人工智能·后端·spring·langchain
昨夜见军贴061621 小时前
IACheck AI审核技术赋能消费认证:为智能宠物喂食器TELEC报告构筑智能合规防线
人工智能·宠物
DisonTangor21 小时前
阿里开源语音识别模型——Qwen3-ASR
人工智能·开源·语音识别
万事ONES21 小时前
ONES 签约北京高级别自动驾驶示范区专设国有运营平台——北京车网
人工智能·机器学习·自动驾驶
qyr678921 小时前
深度解析:3D细胞培养透明化试剂供应链与主要制造商分布
大数据·人工智能·3d·市场分析·市场报告·3d细胞培养·细胞培养
软件开发技术深度爱好者21 小时前
浅谈人工智能(AI)对个人发展的影响
人工智能