[动手学习深度学习]26. 网络中的网络 NiN

前面的LeNet、AlexNet、VGG在设计上的共同之处在于:先以卷积层构成的模块充分抽取空间特征,再以全连接层构成的模块来输出分类结果

其中AlexNet和VGG对LeNet的改进主要在于如何对这两个模块价款(增加通道数)和加深

这一节的NiN提出另一个思路:串联多个由卷积层和"全连接"层构成的小网络来构建一个深层网络

(NiN现在用的不多,但是这里提出的思路用的很多)

全连接层的问题

前面几个网络都在最后用了比较大的全连接层,最后再通过一个全连接层进行输出

但是全连接层非常占用空间,网络的所有参数基本都在全连接层

  • 但是最大的问题是,他会带来过拟合

    假如用卷积层,参数个数=输入通道数*输出通道数*窗口的高*窗口的宽

    若用全连接层,参数个数=输入的所有像素*输出的所有像素*窗口的高*窗口的宽

    如上面LeNet:120是输出的隐藏层的大小,16是最后一个卷积层的输出通道数,5是压缩的大小

NiN块

  • 1个卷积层后跟2个全连接层(11的卷积层等价于是全连接层)
    步幅1,无填充,输出形状和卷积层输出一样,也不会改变通道数

    这里两个1
    1的卷积层,其实是当作全连接层用的,他唯一的作用是对每个通道进行混合

NiN架构

  • 无全连接层

  • 交替使用NiN块和步幅为2的最大池化层

    • 逐步减小高宽和增大通道数
  • 最后使用全局平均池化层得到输出

    • 全局平均池化层:池化层的高宽=输入的高宽 -> 取每一个通道的最大值
    • 输入通道数是类别数

    (如:若在最后的全局池化层输入的通道是1000的话,对每一个通道拿出一个值,把这个值当作这个类别的预测,再加上softmax就是类别的概率了)

所以最后也不需要使用全连接层->这是一个非常极端的设计

总结

  • NiN块使用卷积层+2个11卷积层
    1
    1的卷积层充当全连接层,对每个像素增加了非线性
  • NiN使用全局平均池化层来代替VGG和AlexNet中的全连接层
    • 不容易过拟合,更少的参数个数

所以NiN相对于前面结构比较简单,参数个数非常少(因为没有全连接层)

相关推荐
FPGA小迷弟3 分钟前
高频时钟设计:FPGA 多时钟域同步与时序收敛实战方案
前端·学习·fpga开发·verilog·fpga
sensen_kiss19 分钟前
CPT306 Principles of Computer Games Design 电脑游戏设计原理 Pt.3 实时图形
学习·计算机视觉
Predestination王瀞潞23 分钟前
5.4.2 通信->WWW万维网内容访问标准(W3C):WWW(World Wide Web) 核心技术规范
网络·网络协议·https·www
@insist12327 分钟前
软件设计师-组网技术基础:网络设备、传输介质与局域网核心协议
开发语言·网络·软考·软件设计师·软件水平考试
東雪木40 分钟前
编程算法学习——栈与队列算法
学习·算法·排序算法
青瓷程序设计1 小时前
【果蔬识别系统】Python+深度学习+人工智能+算法模型+图像识别+2026原创
人工智能·python·深度学习
虾..1 小时前
TCP协议
网络·网络协议·tcp/ip
ADHD多动联盟1 小时前
什么是儿童ADHD的运动干预方案?主要有怎样的应对分心走神的疗法?
学习·学习方法·玩游戏
2501_918126911 小时前
学习所有6502写游戏地图的语句
汇编·嵌入式硬件·学习·游戏·个人开发
智算菩萨1 小时前
元认知AI素养:来自交互式AI展览的发现——文献精读
论文阅读·人工智能·深度学习·ai