基于图像识别的迁移学习之一

案例分析

加载数据部分同上一个案例,只需把数据输入到预训练的VGG-16或者ResNet50中。VGG-16的网络结构为右侧图绿色栏所示,其中block1中有2个包含64个卷积核的卷积层,block2包含2个128个卷积核的卷积层,block3有3个包含256个卷积核的卷积层,block4有3个包含512个卷积核的卷积层,block5有3个包含512个卷积核的卷积层,加上2个包含4096个神经元的全连接层和1个包含1000个神经元的全连接层。

ResNet有2个基本的block,一个是identity block,输入和输出的维度是一样的,所以可以串联多个;另外一个基本block是conv block,输入和输出的维度是不一样的,所以不能连续串联,它的作用本来就是为了改变特征向量的维度。

ResNet50网络结构中block_sizes=[3, 4, 6, 3]指的是stage1(first pool)之后的4个layer的block数,分别对应res2,res3,res4,res5,每一个layer的第一个block在shortcut上做conv+BN,即conv block。

相关推荐
tangdou3690986551 天前
安装使用 Claude Code IDE 插件并接入方舟 Coding Plan
人工智能·ai编程
共绩算力1 天前
Pop-Up Book 风格05|凡人修仙传:海外风云 Pop-Up Book 风格AI生图提示词指南
人工智能·共绩算力
网管NO.11 天前
OpenClaw 完整配置详解 - 逐项深度剖析
运维·网络·人工智能
m0_488913011 天前
收藏备用!大厂AI Agent开发岗位解析+小白友好学习路线(程序员必看)
人工智能·学习·langchain·大模型·agent·就业·大模型学习
mit6.8241 天前
agent|世界模型|产业链
人工智能
新缸中之脑1 天前
智能体间通信实践指南
人工智能
GOWIN革文品牌咨询1 天前
国际B2B品牌定位,先把“角色模型”搭出来
大数据·人工智能
皮卡 | 皮卡 | 丘尊1 天前
关于相机和坐标的问题
人工智能·数码相机·计算机视觉
踩着两条虫1 天前
VTJ.PRO 在线应用开发平台的工作台与后台管理视图
前端·人工智能·ai编程
人工智能AI技术1 天前
谷歌Google Translate“实时翻译“功能正式登陆iOS平台
人工智能