深度学习基础

深度学习基础

high variance/data mismatch

what is data mismatch

如果训练集和验证集的loss不一样,且验证集的loss高很多,有2种原因:

1.方差太大。模型没见过,没学习到;

2.数据不匹配。训练集和验证集的数据分布不同。

how to solve data mismatch

currently no systematic ways to solve, so try:

  1. manually error analysis
  2. make training and dev sets more similar.

data synthesis数据合成

make similar的方法包括数据合成。比如含有噪音的音频。

但是要注意:噪音背景需要和清晰的音频一样diverse,不能音频有1000条,噪音只有1条,要不然可能过拟合。

该方法在音频识别种效果很好。

迁移学习与预训练/微调

迁移学习是原本适用于taskA的模型同样应用在taskB。

为了能够使其适用于TaskB,需要对模型进行进一步训练,这个过程取决于taskB的样本数量。

  1. 如果样本数量较少,就重新训练最后一层layer或最后几层,其他layers固定不变;
  2. 如果样本数量很多,可以对整个模型重新进行训练。
    对于最终的taskB来说,taskA过程的训练就是预训练,对于taskB的训练是微调。

什么时候用迁移学习

  1. taskA和taskB输入相同,如都是图片
  2. taskA的样本远多于taskB
  3. taskA的低层次特征low level features有助于taskB
相关推荐
黎燃2 小时前
人工智能在法律文书自动生成中的深度实践:从语言模型到审判逻辑的可解释对齐
人工智能
哔哩哔哩技术5 小时前
TextFlux重磅发布:告别复杂控制信号!多语种高保真场景文本编辑新时代
人工智能
小白狮ww5 小时前
LAMMPS 教程:移动原子演示
人工智能·深度学习·机器学习
聚客AI6 小时前
⭐超越CNN与RNN:为什么Transformer是AI发展的必然选择?
人工智能·llm·掘金·日新计划
快手技术6 小时前
可灵AI数字人来了!快手重磅发布Kling-Avatar,面向多模态指令理解与控制的数字人长视频生成新范式
人工智能
算家计算7 小时前
PDF解析神器——MinerU本地部署教程,一键去除页眉页脚,精准提取公式表格,支持84种语言,让文档转换更简单!
人工智能·开源
逛逛GitHub7 小时前
面壁「小钢炮」最新开源!0.5B 的声音克隆神器。
人工智能·github
后端小肥肠8 小时前
Coze 一键生成 AI 星座漫画,从 0 到 1 拿捏 10w + 流量!,小白可学
人工智能·aigc·coze
canonical_entropy8 小时前
AI的集体反思:我们为什么未能预见到"可逆计算"的演进方向?
人工智能·低代码·aigc