深度学习基础

深度学习基础

high variance/data mismatch

what is data mismatch

如果训练集和验证集的loss不一样,且验证集的loss高很多,有2种原因:

1.方差太大。模型没见过,没学习到;

2.数据不匹配。训练集和验证集的数据分布不同。

how to solve data mismatch

currently no systematic ways to solve, so try:

  1. manually error analysis
  2. make training and dev sets more similar.

data synthesis数据合成

make similar的方法包括数据合成。比如含有噪音的音频。

但是要注意:噪音背景需要和清晰的音频一样diverse,不能音频有1000条,噪音只有1条,要不然可能过拟合。

该方法在音频识别种效果很好。

迁移学习与预训练/微调

迁移学习是原本适用于taskA的模型同样应用在taskB。

为了能够使其适用于TaskB,需要对模型进行进一步训练,这个过程取决于taskB的样本数量。

  1. 如果样本数量较少,就重新训练最后一层layer或最后几层,其他layers固定不变;
  2. 如果样本数量很多,可以对整个模型重新进行训练。
    对于最终的taskB来说,taskA过程的训练就是预训练,对于taskB的训练是微调。

什么时候用迁移学习

  1. taskA和taskB输入相同,如都是图片
  2. taskA的样本远多于taskB
  3. taskA的低层次特征low level features有助于taskB
相关推荐
用户51914958484527 分钟前
HP Sound Research SECOMNService 权限提升漏洞利用工具
人工智能·aigc
用户0183493016932 分钟前
给 AI 智能体能力包一层 BFF,前端只调一个接口
人工智能
这token有力气4 小时前
Function Calling 格式漂移
人工智能
onething3654 小时前
Spring Boot + Spring AI 从入门到实战:7天转型计划 Day 5 —— SSE 流式输出 + 打字机效果
人工智能·后端·全栈
onething3655 小时前
Spring Boot + Spring AI 从入门到实战:7天转型计划 Day 6 —— 业务完善 + 会话消息预览
人工智能·后端·全栈
IT_陈寒5 小时前
SpringBoot自动配置的坑,我爬了三天才出来
前端·人工智能·后端
甲维斯6 小时前
笑抽了!DeepSeek识图,豆包完胜了!
人工智能·deepseek
Lei活在当下15 小时前
【AI手记系列-2026/6/18】iSparto & Harness,Caveman 以及AI时代的生存指南
人工智能·llm·openai
冬奇Lab16 小时前
每日一个开源项目(第134篇):Zvec - 阿里开源的嵌入式向量数据库,向量搜索界的 SQLite
数据库·人工智能·llm
冬奇Lab16 小时前
Agent 系列(22):Context Engineering 深度——三种上下文管理策略的量化对比
人工智能·agent