基于图像识别的迁移学习之一

案例分析

加载数据部分同上一个案例,只需把数据输入到预训练的VGG-16或者ResNet50中。VGG-16的网络结构为右侧图绿色栏所示,其中block1中有2个包含64个卷积核的卷积层,block2包含2个128个卷积核的卷积层,block3有3个包含256个卷积核的卷积层,block4有3个包含512个卷积核的卷积层,block5有3个包含512个卷积核的卷积层,加上2个包含4096个神经元的全连接层和1个包含1000个神经元的全连接层。

ResNet有2个基本的block,一个是identity block,输入和输出的维度是一样的,所以可以串联多个;另外一个基本block是conv block,输入和输出的维度是不一样的,所以不能连续串联,它的作用本来就是为了改变特征向量的维度。

ResNet50网络结构中block_sizes=[3, 4, 6, 3]指的是stage1(first pool)之后的4个layer的block数,分别对应res2,res3,res4,res5,每一个layer的第一个block在shortcut上做conv+BN,即conv block。

相关推荐
AI浩3 小时前
学习嵌入位置:面向小目标检测查询检索的噪声感知位置编码
人工智能·学习·目标检测
youcans_7 小时前
【HALCON机器视觉实战】专栏介绍
图像处理·人工智能·计算机视觉·halcon
火山引擎开发者社区7 小时前
火山引擎 veRoCE 获权威认证:IANA 官方为 veRoCE 分配专属 UDP 端口号 4794
人工智能
飘落的数码折腾日记7 小时前
你的AI Agent可能正在“叛变“ | 5类真实威胁与四层防御
人工智能
放羊郎8 小时前
基于ORB-SLAM2算法的优化工作
人工智能·算法·计算机视觉
AI袋鼠帝8 小时前
字节的技术决心,都藏在这个动作里
人工智能
AI袋鼠帝8 小时前
企微又偷偷进化AI,并开始不对劲了..
人工智能
工业机器人销售服务8 小时前
2026 年,探索专业伯朗特机器人的奇妙世界
人工智能·机器人
摆烂大大王9 小时前
AI 日报|2026年5月9日:四部门力推AI与能源双向赋能,AI终端国标出台,中国大模型融资潮涌
人工智能
萑澈9 小时前
编程能力强和多模态模型的模型后训练
人工智能·深度学习·机器学习