C2-3.3.3 迁移学习

C2-3.3.3 迁移学习

1、为什么要使用-迁移学习

和 "数据增强" [C2-3.3.2 数据增强.md](C2-3.3.2 数据增强.md) 相比, 有一些应用程序没有那么多数据 ,而且 很难获取到更多的数据 ------"迁移学习 " 诞生

迁移学习 在实际的应用中使用的很频繁,非常受欢迎

2、迁移学习举例

我们这里已经有一个成熟的模型,进行1000个类别分类。分成:猫、狗、车、人... 。 但是我们想要一个能实现手写体识别的模型,但是我们手里的数据很少,比如有50个吧(也不能实现数据增强)。有两种方法能实现:

  • 方法一 - 迁移学习:把人家预训练好的模型拿过来: 除了最后一层输出层以外留下所有层的参数 w , b 。 把输出层换成一个 比较小的有10个神经元的输出层(因为有10种结果的判别,簇类)。通过我们手里有的50个 手写体数据,对模型进行训练,只训练输出层的参数。
  • 方法二-传统的方法:需要很大的数据集,从头到尾进行训练

3、为什么迁移学习能胜任这份工作呢

因为在前几层 隐藏层中 做的功能都是差不多的,只不过是后面的输出层 有一些不同(有可能有时倒数几层开始不同)

4、迁移学习 总结 / 步骤

【※注释】:必须是同一个输入类型

相关推荐
只说证事16 分钟前
2025年数字公共治理专业重点学什么内容?(详细指南)
人工智能
LeeZhao@16 分钟前
【AI推理部署】Docker篇04—Docker自动构建镜像
人工智能·docker·容器
程思扬20 分钟前
利用JSONCrack与cpolar提升数据可视化及跨团队协作效率
网络·人工智能·经验分享·docker·信息可视化·容器·架构
南方者25 分钟前
它的 AI Agent 凭什么能擦出火花?!
人工智能·ai编程
心动啊12128 分钟前
深度神经网络1——梯度问题+标签数不够问题
人工智能·神经网络·dnn
南方者31 分钟前
基于Amazon Bedrock Agent 的两个服务示例的完整流程与详细内容,包含技术架构、实现细节、交互逻辑及扩展能力
人工智能·ai编程·敏捷开发
小王爱学人工智能34 分钟前
OpenCV一些进阶操作
人工智能·opencv·计算机视觉
新智元39 分钟前
起猛了!这个国家任命 AI 为「部长」:全球首个,手握实权,招标 100% 透明
人工智能·openai
张较瘦_40 分钟前
[论文阅读] 人工智能 + 软件工程 | 大语言模型驱动的多来源漏洞影响库识别研究解析
论文阅读·人工智能·语言模型
艾醒1 小时前
大模型面试题剖析:RAG中的文本分割策略
人工智能·算法