C2-3.3.3 迁移学习

帅翰GG2024-01-10 8:03

C2-3.3.3 迁移学习

1、为什么要使用-迁移学习

和 "数据增强" [C2-3.3.2 数据增强.md](C2-3.3.2 数据增强.md) 相比，有一些应用程序没有那么多数据 ，而且 很难获取到更多的数据 ------"迁移学习 " 诞生

迁移学习在实际的应用中使用的很频繁，非常受欢迎

2、迁移学习举例

我们这里已经有一个成熟的模型，进行1000个类别分类。分成：猫、狗、车、人... 。但是我们想要一个能实现手写体识别的模型，但是我们手里的数据很少，比如有50个吧（也不能实现数据增强）。有两种方法能实现：

方法一 - 迁移学习：把人家预训练好的模型拿过来：除了最后一层输出层以外留下所有层的参数 w , b 。把输出层换成一个比较小的有10个神经元的输出层（因为有10种结果的判别，簇类）。通过我们手里有的50个手写体数据，对模型进行训练，只训练输出层的参数。
方法二-传统的方法：需要很大的数据集，从头到尾进行训练

3、为什么迁移学习能胜任这份工作呢

因为在前几层隐藏层中做的功能都是差不多的，只不过是后面的输出层有一些不同（有可能有时倒数几层开始不同）

4、迁移学习总结 / 步骤

【※注释】：必须是同一个输入类型

上一篇：来聊聊关键字ThreadLocal

下一篇：一文带你了解Quartz

热门推荐

01UV安装并设置国内源 02KGG转MP3工具|非KGM文件|解密音频 03Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 04DeepSeek更新！速览DeepSeek V3.1新特性 05蜘蛛磁力搜索引擎大全，如何使用蜘蛛磁力查找磁力链接 06Claude Code VSCode集成开发指南：AI编程助手完整配置 07【2025.08.06最新版】Android Studio下载、安装及配置记录（自动下载sdk）08Spring 调试终于不再痛苦了 092025最新国内服务器可用docker源仓库地址大全（2025年8月更新）10NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南