4.2.1 分类任务

4.2.1 分类任务

分类模型的核心结构包括:输入à特征提取(卷积层)à 分类决策(全连接层),代表模型如下。

* LeNet-5:卷积网络的基石,确定了CNN的架构范式,验证了CNN可行。

* AlexNet:承上启下的划时代模型,结构更深,引入ReLU和dropout。

* VGG:堆叠3×3小卷积核替代大卷积核,结构非常规整,探索增加网络深度。

* GoogLeNet:引入Inception模块在单一层内提取多个尺度特征,开创并行多分支网络结构,所用1×1卷积成为深度网络标准配置。

* ResNet:里程碑式的革命性模型,提出了残差学习范式,引入的快捷连接也成为现代深度网络的标配,使得网络可以达到上千层;ResNet及其变体至今仍是许多任务最常用的骨干网络。

1.结构特点

以上代表模型的核心结构特点是:(1)一系列的卷积层、池化层进行特征提取,(2)最后通过全局平均池化或者展平层连接全连接层,(3)输出层使用softmax函数输出每个类别的概率。

2.骨干网络

由于现代CNN模型结构已经基本形成"输入à 骨干网络à 分类器"这样一种范式,因此上述LeNet、AlexNet、VGG、GoogLeNet、ResNet都是骨干网络的杰出代表,它们的设计哲学例如堆叠小卷积核、残差连接、分组卷积等,影响了后续所有视觉任务模型。

相关推荐
进击的野人3 分钟前
MCP协议:让AI应用像插USB一样连接外部世界
人工智能·agent·mcp
清空mega3 分钟前
动手学深度学习——SSD
人工智能·深度学习
tinochen5 分钟前
我用 OpenClaw 搭了一套全自动 AI 行业简报系统,每天零干预推送到飞书
人工智能
何陋轩5 分钟前
OpenAI Codex深度解析:终端里的AI代码特工,一个指令重构整个项目
人工智能·面试
jarvisuni6 分钟前
三大编程智能体的RULES和SKILLS规范!
人工智能·ai编程
Kel10 分钟前
PydanticAI 源码深潜:类型安全依赖注入与图执行引擎的双核架构解析
人工智能·python·架构
后端开发基础免费分享11 分钟前
Claude Code 最全使用指南:CLAUDE.md、rules、skills、memory 一次讲清
人工智能·ai·claude·claudecode
亿坊电商12 分钟前
亿坊外贸商城系统-支持B2C,B2B多模式,让企业做外贸电商更简单!
人工智能·数据挖掘·外贸商城
小王毕业啦16 分钟前
2006-2023年 省级-建成区绿化覆盖率数据(xlsx)
大数据·人工智能·数据挖掘·数据分析·社科数据·实证分析·经管数据
十有八七16 分钟前
OpenHarness 架构说明文档
人工智能·架构