每天五分钟计算机视觉:ImageNet大赛的世界冠军AlexNet模型

AlexNet模型

2012 Imagenet 比赛第一,Top5准确度超出第二10% ,它让人们认识到了深度学习技术的威力。比 LeNet更深,用多层小卷积层叠加替换大卷积层,就是说每一个卷积层的通道数小,不像LeNet一样每个卷积层的通道数很大。

AlexNet

一张227×227×3的图片作为输入,第一层我们使用 96 个11×11 的过滤器,步幅为 4,由于步幅是 4,因此尺寸缩小到 55×55,缩小了 4 倍左右。

然后用一个 3×3 的过滤器构建最大池化层, = 3,步幅为 2,卷积层尺寸缩小为 27×27×96。接着再执行一个 5×5 的卷积,padding 之后,输出是 27×27×276。

然后再次进行最大池化,尺寸缩小到 13×13。再执行一次 same 卷积,相同的 padding,得到的结果是 13×13×384,384个过滤器。再做一次 same 卷积,就像这样。

再做一次同样的操作,最后再进行一次最大池化,尺寸缩小到 6×6×256。

6×6×256 等于 9216,将其展开为 9216 个单元,然后是一些全连接层。

最后使用 softmax 函数输出识别的结果,看它究竟是 1000 个可能的对象中的哪一个。

AlexNet 包含约 6000 万个参数。当用于训练图像和数据集时,AlexNet 能够处理非常相似的基本构造模块,这些模块往往包含着大量的隐藏单元或数据,这一点 AlexNet 表现出色。AlexNet 比 LeNet 表现更为出色的另一个原因是它使用了 ReLu 激活函数。

相关推荐
说私域19 小时前
“开源AI智能名片链动2+1模式S2B2C商城小程序”在县级市场的应用与挑战分析
人工智能·小程序·开源
GoldenSpider.AI20 小时前
突破AI视频一致性瓶颈:“无废话”四步电影级工作流
人工智能·flow·elevenlabs·google whisk·gemini gem
编程小白_正在努力中20 小时前
第七章深度解析:从零构建智能体框架——模块化设计与全流程落地指南
人工智能·深度学习·大语言模型·agent·智能体
机器之心20 小时前
VinciCoder:多模态统一代码生成框架和视觉反馈强化学习,数据代码模型权重已开源
人工智能·openai
化作星辰20 小时前
深度学习_三层神经网络传播案例(L0->L1->L2)
人工智能·深度学习·神经网络
机器之心20 小时前
首个完整开源的生成式推荐框架MiniOneRec,轻量复现工业级OneRec!
人工智能·openai
_codemonster20 小时前
深度学习实战(基于pytroch)系列(十五)模型构造
人工智能·深度学习
海域云赵从友21 小时前
2025年印尼服务器选型指南:跨境业务落地的合规与性能双解
人工智能·git·github
用户51914958484521 小时前
cURL变量管理中的缓冲区越界读取漏洞分析
人工智能·aigc
iFlow_AI1 天前
增强AI编程助手效能:使用开源Litho(deepwiki-rs)深度上下文赋能iFlow
人工智能·ai·ai编程·命令模式·iflow·iflow cli·心流ai助手