每天五分钟计算机视觉:ImageNet大赛的世界冠军AlexNet模型

AlexNet模型

2012 Imagenet 比赛第一,Top5准确度超出第二10% ,它让人们认识到了深度学习技术的威力。比 LeNet更深,用多层小卷积层叠加替换大卷积层,就是说每一个卷积层的通道数小,不像LeNet一样每个卷积层的通道数很大。

AlexNet

一张227×227×3的图片作为输入,第一层我们使用 96 个11×11 的过滤器,步幅为 4,由于步幅是 4,因此尺寸缩小到 55×55,缩小了 4 倍左右。

然后用一个 3×3 的过滤器构建最大池化层, = 3,步幅为 2,卷积层尺寸缩小为 27×27×96。接着再执行一个 5×5 的卷积,padding 之后,输出是 27×27×276。

然后再次进行最大池化,尺寸缩小到 13×13。再执行一次 same 卷积,相同的 padding,得到的结果是 13×13×384,384个过滤器。再做一次 same 卷积,就像这样。

再做一次同样的操作,最后再进行一次最大池化,尺寸缩小到 6×6×256。

6×6×256 等于 9216,将其展开为 9216 个单元,然后是一些全连接层。

最后使用 softmax 函数输出识别的结果,看它究竟是 1000 个可能的对象中的哪一个。

AlexNet 包含约 6000 万个参数。当用于训练图像和数据集时,AlexNet 能够处理非常相似的基本构造模块,这些模块往往包含着大量的隐藏单元或数据,这一点 AlexNet 表现出色。AlexNet 比 LeNet 表现更为出色的另一个原因是它使用了 ReLu 激活函数。

相关推荐
黄小耶@几秒前
基于 CNN 的猫狗分类实战
人工智能·分类·cnn
光算科技4 分钟前
YouTube视频字幕转成文章算重复内容吗?
人工智能·音视频
彼岸花开了吗5 分钟前
构建AI智能体:五十二、反应式智能体:基于“感知-行动”,AI世界的条件反射
人工智能·python·agent
undsky8 分钟前
【n8n教程】:从日志到监控再到安全审计,让你的n8n实例运行无忧
人工智能·aigc·ai编程
Ydwlcloud9 分钟前
2025年腾讯云支付宝充值教程:步骤详解与支付渠道新思路
服务器·人工智能·云计算·腾讯云
semantist@语校13 分钟前
第五十四篇|从事实字段到推理边界:名古屋国际外语学院Prompt生成中的过度推断防御设计
大数据·linux·服务器·人工智能·百度·语言模型·prompt
weixin_4296907216 分钟前
# 数字人系统开发:如何选择可靠的开源方案在人工智能和虚
人工智能·python·开源
中冕—霍格沃兹软件开发测试21 分钟前
用户体验测试:功能与界面并重
人工智能·科技·开源·appium·bug·ux
雪兽软件23 分钟前
2025 年人工智能实施的成本是多少?
人工智能
AndrewHZ32 分钟前
【图像处理基石】如何入门图像金字塔算法技术?
图像处理·算法·计算机视觉·cv·拉普拉斯变换·图像金字塔