基于图像识别的迁移学习之一

案例分析

加载数据部分同上一个案例,只需把数据输入到预训练的VGG-16或者ResNet50中。VGG-16的网络结构为右侧图绿色栏所示,其中block1中有2个包含64个卷积核的卷积层,block2包含2个128个卷积核的卷积层,block3有3个包含256个卷积核的卷积层,block4有3个包含512个卷积核的卷积层,block5有3个包含512个卷积核的卷积层,加上2个包含4096个神经元的全连接层和1个包含1000个神经元的全连接层。

ResNet有2个基本的block,一个是identity block,输入和输出的维度是一样的,所以可以串联多个;另外一个基本block是conv block,输入和输出的维度是不一样的,所以不能连续串联,它的作用本来就是为了改变特征向量的维度。

ResNet50网络结构中block_sizes=[3, 4, 6, 3]指的是stage1(first pool)之后的4个layer的block数,分别对应res2,res3,res4,res5,每一个layer的第一个block在shortcut上做conv+BN,即conv block。

相关推荐
索迪迈科技3 分钟前
登顶 NAVSIM!博世最新IRL-VLA:逆强化学习重构自动驾驶VLA闭环训练
人工智能·重构·自动驾驶
Dfreedom.10 分钟前
在Windows上搭建GPU版本PyTorch运行环境的详细步骤
c++·人工智能·pytorch·python·深度学习
easy202015 分钟前
从机器学习的角度实现 excel 中趋势线:揭秘梯度下降过程
笔记·机器学习·线性回归
confiself19 分钟前
AndroidWorld+mobileRL
人工智能·深度学习
aneasystone本尊28 分钟前
学习 Chat2Graph 的任务分解与执行
人工智能
嘀咕博客29 分钟前
10Web-AI网站生成器
人工智能·ai工具
西柚小萌新35 分钟前
【从零开始的大模型原理与实践教程】--第一章:NLP基础概念
人工智能·自然语言处理
嘀咕博客41 分钟前
SafeEar:浙大和清华联合推出的AI音频伪造检测框架,错误率低至2.02%
人工智能·音视频·ai工具
Hello123网站41 分钟前
FinChat-金融领域的ChatGPT
人工智能·chatgpt·金融·ai工具
嘀咕博客1 小时前
PixVerse -免费在线AI视频生成工具
人工智能·音视频·ai工具