4.2.1 分类任务

4.2.1 分类任务

分类模型的核心结构包括:输入à特征提取(卷积层)à 分类决策(全连接层),代表模型如下。

* LeNet-5:卷积网络的基石,确定了CNN的架构范式,验证了CNN可行。

* AlexNet:承上启下的划时代模型,结构更深,引入ReLU和dropout。

* VGG:堆叠3×3小卷积核替代大卷积核,结构非常规整,探索增加网络深度。

* GoogLeNet:引入Inception模块在单一层内提取多个尺度特征,开创并行多分支网络结构,所用1×1卷积成为深度网络标准配置。

* ResNet:里程碑式的革命性模型,提出了残差学习范式,引入的快捷连接也成为现代深度网络的标配,使得网络可以达到上千层;ResNet及其变体至今仍是许多任务最常用的骨干网络。

1.结构特点

以上代表模型的核心结构特点是:(1)一系列的卷积层、池化层进行特征提取,(2)最后通过全局平均池化或者展平层连接全连接层,(3)输出层使用softmax函数输出每个类别的概率。

2.骨干网络

由于现代CNN模型结构已经基本形成"输入à 骨干网络à 分类器"这样一种范式,因此上述LeNet、AlexNet、VGG、GoogLeNet、ResNet都是骨干网络的杰出代表,它们的设计哲学例如堆叠小卷积核、残差连接、分组卷积等,影响了后续所有视觉任务模型。

相关推荐
2601_94949994几秒前
芯瑞科技800G硅光模块:为工业智能时代打造高速可靠的光互联底座
人工智能·科技·机器人
小博测试成长之路1 分钟前
行业日报 | 2026年6月12日:Claude新模型、鸿蒙开发者大会与AI工程化加速
人工智能·harmonyos
snpgroupcn3 分钟前
云转型过程中, 如何有效推进Rise with SAP项目实施
大数据·人工智能·云转型
小糖学代码4 分钟前
机器学习:9.贝叶斯分类器
人工智能·机器学习
聆思科技AI芯片6 分钟前
AI语音视觉开发板对接 OpenClaw 龙虾实现多模态交互
人工智能·学习·交互·语音识别·智能硬件
comcoo7 分钟前
颠覆传统办公!本地 AI 智能体 open claw实现电脑全自主操控【包含安装包】
人工智能·开源软件·open claw部署包
林间码客8 分钟前
数据挖掘复习题
人工智能·数据挖掘
Rocktech_ruixun9 分钟前
服务机器人硬件选型指南:RK3588/RK3568核心板适配多场景方案解析
大数据·人工智能·科技·ai·机器人
黑科技研究僧9 分钟前
蘑兔AI的12轨分轨功能:编曲师深度测评
人工智能·经验分享·vscode·学习·新媒体运营·音视频
回眸&啤酒鸭9 分钟前
【回眸】Agency-Agents 智能体协作效果全景展示
人工智能