C2-3.3.3 迁移学习

C2-3.3.3 迁移学习

1、为什么要使用-迁移学习

和 "数据增强" [C2-3.3.2 数据增强.md](C2-3.3.2 数据增强.md) 相比, 有一些应用程序没有那么多数据 ,而且 很难获取到更多的数据 ------"迁移学习 " 诞生

迁移学习 在实际的应用中使用的很频繁,非常受欢迎

2、迁移学习举例

我们这里已经有一个成熟的模型,进行1000个类别分类。分成:猫、狗、车、人... 。 但是我们想要一个能实现手写体识别的模型,但是我们手里的数据很少,比如有50个吧(也不能实现数据增强)。有两种方法能实现:

  • 方法一 - 迁移学习:把人家预训练好的模型拿过来: 除了最后一层输出层以外留下所有层的参数 w , b 。 把输出层换成一个 比较小的有10个神经元的输出层(因为有10种结果的判别,簇类)。通过我们手里有的50个 手写体数据,对模型进行训练,只训练输出层的参数。
  • 方法二-传统的方法:需要很大的数据集,从头到尾进行训练

3、为什么迁移学习能胜任这份工作呢

因为在前几层 隐藏层中 做的功能都是差不多的,只不过是后面的输出层 有一些不同(有可能有时倒数几层开始不同)

4、迁移学习 总结 / 步骤

【※注释】:必须是同一个输入类型

相关推荐
快乐非自愿19 分钟前
RAG夺命10连问,你能抗住第几问?
人工智能·面试·程序员
千匠网络3 小时前
破局出海壁垒,千匠网络新能源汽车跨境出海解决方案
人工智能
马丁聊GEO5 小时前
解码AI用户心智,筑牢可信GEO根基——悠易科技深度参与《中国AI用户态度与行为研究报告(2026)》发布会
人工智能·科技
nap-joker5 小时前
Fusion - Mamba用于跨模态目标检测
人工智能·目标检测·计算机视觉·fusion-mamba·可见光-红外成像融合·远距离/伪目标问题
一只幸运猫.5 小时前
2026Java 后端面试完整版|八股简答 + AI 大模型集成技术(最新趋势)
人工智能·面试·职场和发展
Promise微笑5 小时前
2026年国产替代油介损测试仪:油介损全场景解决方案与技术演进
大数据·网络·人工智能
深海鱼在掘金5 小时前
深入浅出 LangChain —— 第三章:模型抽象层
人工智能·langchain·agent
生信碱移5 小时前
PACells:这个方法可以鉴定疾病/预后相关的重要细胞亚群,作者提供的代码流程可以学习起来了,甚至兼容转录组与 ATAC 两种数据类型!
人工智能·学习·算法·机器学习·数据挖掘·数据分析·r语言
workflower5 小时前
具身智能行业应用-生活服务业
大数据·人工智能·机器人·动态规划·生活
GitCode官方6 小时前
基于昇腾 MindSpeed LLM 玩转 DeepSeekV4-Flash 模型的预训练复现部署
人工智能·开源·atomgit