基于图像识别的迁移学习之一

案例分析

加载数据部分同上一个案例,只需把数据输入到预训练的VGG-16或者ResNet50中。VGG-16的网络结构为右侧图绿色栏所示,其中block1中有2个包含64个卷积核的卷积层,block2包含2个128个卷积核的卷积层,block3有3个包含256个卷积核的卷积层,block4有3个包含512个卷积核的卷积层,block5有3个包含512个卷积核的卷积层,加上2个包含4096个神经元的全连接层和1个包含1000个神经元的全连接层。

ResNet有2个基本的block,一个是identity block,输入和输出的维度是一样的,所以可以串联多个;另外一个基本block是conv block,输入和输出的维度是不一样的,所以不能连续串联,它的作用本来就是为了改变特征向量的维度。

ResNet50网络结构中block_sizes=3, 4, 6, 3指的是stage1(first pool)之后的4个layer的block数,分别对应res2,res3,res4,res5,每一个layer的第一个block在shortcut上做conv+BN,即conv block。

相关推荐
TheRouter2 分钟前
LLM 流式输出工程实践:SSE、背压、断流重连与JSON 流解析的 6 个生产陷阱
人工智能·json
AI浩2 分钟前
OpenCV 检测流程中损坏 JPEG 图片的定位与清理
人工智能·opencv·计算机视觉
算力视野3 分钟前
AMD Instinct MI325X/MI350X路线图深度解析:288GB HBM3e如何硬刚英伟达?
人工智能·gpu算力
中间件XL3 分钟前
ai-agent框架spring ai/alibaba源码原理分析(二) 模型,chat模型,chatclient
人工智能·ai agent·spring ai·agent框架
得物技术7 分钟前
用 LLM Agent 重构告警排查流程|得物技术
java·人工智能·后端
容智信息13 分钟前
提示词工程不是写长说明书,而是做语义压缩
人工智能·prompt·安全威胁分析·提示词·智能体
zandy101120 分钟前
体系化AI创新赋能产业升级 联想集团树立智能时代企业创新标杆
大数据·人工智能
dehuisun20 分钟前
openspec基础实战
人工智能
MacroZheng25 分钟前
阿里Qoder + GLM-5.1,夯爆了!
前端·vue.js·人工智能