基于图像识别的迁移学习之一

案例分析

加载数据部分同上一个案例,只需把数据输入到预训练的VGG-16或者ResNet50中。VGG-16的网络结构为右侧图绿色栏所示,其中block1中有2个包含64个卷积核的卷积层,block2包含2个128个卷积核的卷积层,block3有3个包含256个卷积核的卷积层,block4有3个包含512个卷积核的卷积层,block5有3个包含512个卷积核的卷积层,加上2个包含4096个神经元的全连接层和1个包含1000个神经元的全连接层。

ResNet有2个基本的block,一个是identity block,输入和输出的维度是一样的,所以可以串联多个;另外一个基本block是conv block,输入和输出的维度是不一样的,所以不能连续串联,它的作用本来就是为了改变特征向量的维度。

ResNet50网络结构中block_sizes=[3, 4, 6, 3]指的是stage1(first pool)之后的4个layer的block数,分别对应res2,res3,res4,res5,每一个layer的第一个block在shortcut上做conv+BN,即conv block。

相关推荐
测试_AI_一辰4 分钟前
Agent & RAG 测试工程笔记 01:Tool Calling 跑通 + 本地 PDF 接入(智谱 GLM)
人工智能·笔记·功能测试·自动化·bug
AI营销干货站10 分钟前
原圈科技AI市场分析指南:实时洞察,决胜2026!
大数据·人工智能
agicall.com10 分钟前
信创电话助手(信电助)多设备支持指南
人工智能·语音识别·自动录音·固话座机·离线语音转写
中杯可乐多加冰11 分钟前
RAG 深度实践系列(三):RAG 技术演变与核心架构的深度剖析
人工智能·深度学习·大模型·llm·知识库·rag·graphrag
永霖光电_UVLED14 分钟前
Singulus 获得 microLED 沉积系统新订单
人工智能·制造
会员源码网16 分钟前
小狐狸AI智能机器人2.7.6免授权版源码 – ChatGPT聊天机器人系统
人工智能·chatgpt·机器人
zhengfei61120 分钟前
深入讲解 LLM、RAG 和现实世界 AI 代理应用。
人工智能·chatgpt
凌晨一点的秃头猪24 分钟前
ORB局部描述子提取
人工智能·分类·数据挖掘
独处东汉30 分钟前
freertos开发空气检测仪之延迟函数设计:DWT软件实现
人工智能·stm32·单片机·嵌入式硬件
阿杰学AI32 分钟前
AI核心知识67——大语言模型之NTP (简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·ntp·机械学习