深度学习基础

深度学习基础

high variance/data mismatch

what is data mismatch

如果训练集和验证集的loss不一样,且验证集的loss高很多,有2种原因:

1.方差太大。模型没见过,没学习到;

2.数据不匹配。训练集和验证集的数据分布不同。

how to solve data mismatch

currently no systematic ways to solve, so try:

  1. manually error analysis
  2. make training and dev sets more similar.

data synthesis数据合成

make similar的方法包括数据合成。比如含有噪音的音频。

但是要注意:噪音背景需要和清晰的音频一样diverse,不能音频有1000条,噪音只有1条,要不然可能过拟合。

该方法在音频识别种效果很好。

迁移学习与预训练/微调

迁移学习是原本适用于taskA的模型同样应用在taskB。

为了能够使其适用于TaskB,需要对模型进行进一步训练,这个过程取决于taskB的样本数量。

  1. 如果样本数量较少,就重新训练最后一层layer或最后几层,其他layers固定不变;
  2. 如果样本数量很多,可以对整个模型重新进行训练。
    对于最终的taskB来说,taskA过程的训练就是预训练,对于taskB的训练是微调。

什么时候用迁移学习

  1. taskA和taskB输入相同,如都是图片
  2. taskA的样本远多于taskB
  3. taskA的低层次特征low level features有助于taskB
相关推荐
批量小王子2 小时前
2025-07-15通过边缘线检测图像里的主体有没有出血
人工智能·opencv·计算机视觉
机器学习之心2 小时前
三种深度学习模型(LSTM、CNN-LSTM、贝叶斯优化的CNN-LSTM/BO-CNN-LSTM)对北半球光伏数据进行时间序列预测
深度学习·cnn·lstm·cnn-lstm·贝叶斯优化的cnn-lstm
技术猿188702783512 小时前
实现“micro 关键字搜索全覆盖商品”并通过 API 接口提供实时数据(一个方法)
开发语言·网络·python·深度学习·测试工具
zyhomepage2 小时前
科技的成就(六十九)
开发语言·网络·人工智能·科技·内容运营
停走的风3 小时前
(李宏毅)deep learning(五)--learning rate
人工智能·深度学习·机器学习
fishjar1003 小时前
LLaMA-Factory安装部署
人工智能·深度学习
feifeikon3 小时前
模型篇(Bert llama deepseek)
人工智能·深度学习·自然语言处理
IoT砖家涂拉拉3 小时前
萌宠语聊新模板!借助On-App AI降噪与音频处理技术,远程安抚宠物更轻松、更安心!
人工智能·ai·app·音视频·智能家居·智能硬件·宠物
羡鱼饼饼4 小时前
pytorch深度学习-LSTM—循环神经网络变种
pytorch·rnn·深度学习
马里马里奥-4 小时前
OpenVINO initialization error: Failed to find plugins.xml file
人工智能·openvino