每天五分钟计算机视觉:ImageNet大赛的世界冠军AlexNet模型

AlexNet模型

2012 Imagenet 比赛第一,Top5准确度超出第二10% ,它让人们认识到了深度学习技术的威力。比 LeNet更深,用多层小卷积层叠加替换大卷积层,就是说每一个卷积层的通道数小,不像LeNet一样每个卷积层的通道数很大。

AlexNet

一张227×227×3的图片作为输入,第一层我们使用 96 个11×11 的过滤器,步幅为 4,由于步幅是 4,因此尺寸缩小到 55×55,缩小了 4 倍左右。

然后用一个 3×3 的过滤器构建最大池化层, = 3,步幅为 2,卷积层尺寸缩小为 27×27×96。接着再执行一个 5×5 的卷积,padding 之后,输出是 27×27×276。

然后再次进行最大池化,尺寸缩小到 13×13。再执行一次 same 卷积,相同的 padding,得到的结果是 13×13×384,384个过滤器。再做一次 same 卷积,就像这样。

再做一次同样的操作,最后再进行一次最大池化,尺寸缩小到 6×6×256。

6×6×256 等于 9216,将其展开为 9216 个单元,然后是一些全连接层。

最后使用 softmax 函数输出识别的结果,看它究竟是 1000 个可能的对象中的哪一个。

AlexNet 包含约 6000 万个参数。当用于训练图像和数据集时,AlexNet 能够处理非常相似的基本构造模块,这些模块往往包含着大量的隐藏单元或数据,这一点 AlexNet 表现出色。AlexNet 比 LeNet 表现更为出色的另一个原因是它使用了 ReLu 激活函数。

相关推荐
wei_shuo1 分钟前
基于魔珐星云打造的AI律师智能咨询系统:7×24小时在线、专业法律解答、语音随时交互
人工智能·ai数字人
前端若水1 分钟前
最小化可行智能体(MVP Agent)的设计原则
大数据·人工智能
新知图书8 分钟前
技术方案设计与评审辅助(使用千问)
人工智能·ai助手·千问·高效办公
北京软秦科技有限公司13 分钟前
IACheck AI报告审核:汽车内饰缝线歪斜检测报告,签章零遗漏、合规不踩坑
大数据·人工智能·汽车
名不经传的养虾人22 分钟前
OpenAI GPT-Image-2.0 在线生图实测:$0.01/张,一组“南宋工笔画”看透模型差距
人工智能·深度学习·ai作画·nano banana 2·gpt-image-2
我滴老baby23 分钟前
2026年AI Agent将走向何方?十大趋势深度解析:从多模态融合到自主决策,从端侧部署到具身智能,提前布局下一个万亿级市场
数据库·人工智能·知识图谱
jockerzoo@23 分钟前
AIOPS 系统架构
人工智能
英辰朗迪AI获客24 分钟前
AI动态简报之商业洞察篇
人工智能
安吉升科技25 分钟前
餐厅/食堂客流统计ai智能摄像头,优化餐厅运营效率!
人工智能
效能革命笔记26 分钟前
DevOps工具链选型推荐:聚焦本土适配与安全可控
人工智能·安全·devops