神经网络:池化层知识点

1.CNN中池化的作用

池化层的作用是对感受野内的特征进行选择,提取区域内最具代表性的特征,能够有效地减少输出特征数量,进而减少模型参数量。按操作类型通常分为最大池化(Max Pooling)、平均池化(Average Pooling)和求和池化(Sum Pooling),它们分别提取感受野内最大、平均与总和的特征值作为输出,最常用的是最大池化和平均池化。

2.全局池化的作用

全局池化主要包括全局平均池化和全局最大池化。

接下来,Rocky以全局平均池化为例,讲述其如何在深度学习网络中发挥作用。

刚才已经讲过,全局平均池化就是对最后一层卷积的特征图,每个通道求整个特征图的均值。如下图所示:

一般网络的最后会再接几个全连接层,但全局池化后的feature map相当于一像素,所以最后的全连接其实就成了一个加权相加的操作。这种结构比起直接的全连接更加直观,参数量大大幅下降,并且泛化性能更好:

全局池化的作用:

1.降低信息冗余

  • 池化层有助于提取输入特征图中的主要信息,同时抑制次要信息。这种操作使得模型更专注于重要特征,减少冗余或不相关的特征,有利于模型的训练和泛化能力。

2.特征降维与下采样

  • 池化操作导致输出特征图的尺寸减小,实现了特征降维和下采样的效果。这有助于减少计算量,并提高后续层对图像特征的感知范围,使得一个池化后的像素对应前面图片中的一个区域。

3.特征压缩与网络简化

  • 池化层能够对特征图进行压缩,减少计算资源的消耗,简化网络结构,降低模型复杂度,有助于防止过拟合,提高模型的泛化能力。

4.提升模型的不变性

  • 池化操作有助于提升模型对尺度、旋转和平移的不变性。经过池化后的特征图,在输入特征图的大小或旋转角度发生变化时,输出特征图的大小和旋转角度保持不变。这种不变性有助于提高模型的泛化能力和鲁棒性。

5.实现非线性。

3.池化的分类

A. 一般池化(General Pooling):

在CNN中,池化层用于减小特征图的空间尺寸,以降低计算量并减少过拟合的可能性。最常见的池化操作有两种:

平均池化(Average Pooling):
  • 计算图像区域的平均值作为该区域池化后的值。
  • 能够抑制由于邻域内大小受限造成估计值方差增大的现象。
  • 其特点是对于背景的保留效果更好。
最大池化(Max Pooling):
  • 选取图像区域的最大值作为该区域池化后的值。
  • 能够抑制网络参数误差造成估计均值偏移的现象。
  • 其特点是更好地提取纹理信息。
随机池化(Stochastic Pooling):
  • 根据概率对局部的值进行采样,采样结果便是池化结果。

B. 重叠池化(Overlapping Pooling):

在某些情况下,相邻的池化窗口之间可以有重叠区域。这种情况下一般会设置池化窗口的大小(size)大于步幅(stride)。

重叠池化的特点是相比于常规池化操作,它可以更充分地捕获图像特征,但也可能导致计算量增加。

这些池化方法是CNN中常用的技术手段,用于在保留重要信息的同时减少数据尺寸和参数量,从而改善模型的性能和泛化能力。

4.池化的进阶使用---SPP结构介绍

论文名称:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

下载地址:https://arxiv.org/abs/1406.4729

空间金字塔池化(Spatial Pyramid Pooling,SPP)层的引入解决了在传统卷积神经网络(CNN)中需要固定输入图像尺寸的限制。传统的全连接层对于输入要求固定大小的特征向量,这意味着所有输入图像需要统一尺寸,通常需要进行裁剪或拉伸,导致图像失真。SPP层允许网络接受不同尺寸的输入图像,通过金字塔形状的池化区域对不同大小的特征图进行整合和提取特征。其作用在于将不同大小的特征图转换成固定大小的特征向量,使得在连接全连接层之前,所有输入都具有相同的大小,无需提前处理图像。这种灵活性提高了网络的适用性和泛化能力,使得模型能够更灵活地处理各种尺寸的输入。


SPP(空间金字塔池化)的显著特点有:

固定大小的输出:无论输入尺寸如何,SPP能够产生固定大小的输出,克服了全连接层要求固定长度输入的限制。

多个窗口的池化:SPP采用多个窗口的池化,使其能够在不同尺度下提取特征。

尺度不变性和特征一致性:可以处理不同纵横比和尺寸的输入图像,增强了模型的尺度不变性,降低了过拟合的风险。

其他特点包括:

多样性训练图像对网络收敛更容易:SPP允许训练使用不同尺寸的图像,相较于单一尺寸的训练图像,这种多样性训练更有利于网络的收敛。

独立于特定网络设计和结构:SPP可用作卷积神经网络的最后一层,不会影响网络结构,仅替换了原本的池化层。

适用于图像分类和目标检测:SPP不仅适用于图像分类,还可用于目标检测等任务,扩展了其应用领域。

SPP的这些特点使得它成为一个强大的工具,在处理不同尺寸、不同纵横比的图像时,保持固定长度特征向量的输出,提高了模型的灵活性和泛化能力。

相关推荐
桃源学社(接毕设)6 分钟前
基于MATLAB的运动模糊图像修复方法研究(LW+源码+讲解+部署)
图像处理·深度学习·计算机视觉·matlab·毕业设计·图像滤波去噪
钢铁男儿10 分钟前
PyTorch 机器学习基础(机器学习一般流程)
人工智能·pytorch·机器学习
老鱼说AI11 分钟前
当自回归模型遇上扩散模型:下一代序列预测模型详解与Pytorch实现
人工智能·pytorch·深度学习·神经网络·语言模型·自然语言处理·stable diffusion
兰亭妙微11 分钟前
用户体验设计 | 从UX到AX:人工智能如何重构交互范式?
人工智能·重构·ux
2501_9247311115 分钟前
智慧城市交通场景误检率↓78%!陌讯多模态融合算法实战解析
人工智能·算法·目标检测·视觉检测·智慧城市
掘金安东尼1 小时前
机器在看“断言”:AI 消费时代的内容策略升级
人工智能
木头左1 小时前
利用机器学习优化Backtrader策略原理与实践
人工智能·机器学习
2501_924534894 小时前
智慧零售商品识别误报率↓74%!陌讯多模态融合算法在自助结算场景的落地优化
大数据·人工智能·算法·计算机视觉·目标跟踪·视觉检测·零售
盖雅工场4 小时前
连锁零售排班难?自动排班系统来解决
大数据·人工智能·物联网·算法·零售
bryant_meng6 小时前
【Apache MXNet】
人工智能·apache·mxnet