每天五分钟计算机视觉:网络中的网络(NiN)

本文重点

前面的课程中我们学习了众多的经典网络模型,比如LeNet、AlexNet、VGG等等,这些网络模型都有共同的特点。

它们的特点是:先由卷积层构成的模块充分提取空间特征,然后再由全连接层构成的模块来输出分类结果。也就是说它们都是下面的这种效果,先卷积后全连接:

它们的不同在于对卷积层中卷积核的大小以及卷积层的层数进行了改变,其它的变化不大。而本文我们将学习另外一个思想的卷积神经网络,这个卷积神经网络就是NiN,它的思想是:串联多个由卷积层核全连接层构成的小网络来构成一个深层网络。

1*1卷积核的应用

卷积层的输入和输出的维度信息通常是(样本、通道、长、宽)。而全连接层的输入和输出通常是二维数组(样本,特征)。

所以维度不一样,就无法让全连接层之后连上卷积层,这里我们可以使用1*1的卷积层,前面我们学习过1*1的卷积层可以看成是全连接层,使用1*1的卷积层使得空间信息自然的传递到后面的层中去。

NiN模型

不用怎么来介绍这两个模型的不同,只需要看这个图就可以看出二者的不同。

AlexNet和NiN

NiN和AlexNet比较相似,它是在AlexNet之后被提出来的,这里我们对二者做一个简单的区别:

NiN去掉了AlexNet最后的3个全连接层,它使用了输出通道数与分类类别数相等的NiN块,然后使用全局平均池化层对每个通道中的所有元素求平均并直接用于分类。这样可以有效的减少模型的参数尺寸,从而缓解过拟合问题,当然坏处就是会增加模型的训练时间。

相关推荐
勾股导航7 分钟前
大模型Skill
人工智能·python·机器学习
卷福同学2 小时前
【养虾日记】Openclaw操作浏览器自动化发文
人工智能·后端·算法
春日见3 小时前
如何入门端到端自动驾驶?
linux·人工智能·算法·机器学习·自动驾驶
柒.梧.3 小时前
吃透HTTP及相关协议核心区别,从基础到进阶全覆盖
网络·网络协议·http
光锥智能3 小时前
从自动驾驶到 AI 能力体系,元戎启行 GTC 发布基座模型新进展
人工智能
luoganttcc3 小时前
自动驾驶 世界模型 有哪些
人工智能·机器学习·自动驾驶
潘高3 小时前
10分钟教你手撸一个小龙虾(OpenClaw)
人工智能
禁默3 小时前
光学与机器视觉:解锁“机器之眼”的核心密码-《第五届光学与机器视觉国际学术会议(ICOMV 2026)》
人工智能·计算机视觉·光学
深小乐3 小时前
不是DeepSeek V4!这两个神秘的 Hunter 模型竟然来自小米
人工智能
laozhao4323 小时前
科大讯飞中标教育管理应用升级开发项目
大数据·人工智能