深度学习:池化(Pooling)

池化(Pooling)操作在卷积神经网络中用于降低特征图的尺寸,减少计算量,并提供某种程度的平移不变性。我们以最常用的最大池化(Max Pooling)为例,来解释池化操作之后的特征图大小计算。
假设有以下参数:
  • 输入特征图大小: ( H i n × W i n ) ( H{in} \times W{in} ) (Hin×Win)
  • 池化窗口大小: ( K × K ) ( K \times K ) (K×K)
  • 步幅:( S )
  • 填充:( P )
池化之后的输出特征图大小可以用以下公式计算:

H o u t = ⌊ H i n − K + 2 P S ⌋ + 1 H{out} = \left\lfloor \frac{H{in} - K + 2P}{S} \right\rfloor + 1 Hout=⌊SHin−K+2P⌋+1
W o u t = ⌊ W i n − K + 2 P S ⌋ + 1 W{out} = \left\lfloor \frac{W{in} - K + 2P}{S} \right\rfloor + 1 Wout=⌊SWin−K+2P⌋+1

示例

假设输入特征图的大小是 ( 4 × 4 ) (4 \times 4) (4×4),池化窗口大小是 (2 \\times 2),步幅是 (2),无填充(即 (P = 0))。

参数:

  • ( H i n = 4 ) ( H_{in} = 4 ) (Hin=4)
  • ( W i n = 4 ) ( W_{in} = 4 ) (Win=4)
  • ( K = 2 )
  • ( S = 2 )
  • ( P = 0 )
计算:

H o u t = ⌊ 4 − 2 + 0 2 ⌋ + 1 = ⌊ 2 2 ⌋ + 1 = 1 + 1 = 2 H{out} = \left\lfloor \frac{4 - 2 + 0}{2} \right\rfloor + 1 = \left\lfloor \frac{2}{2} \right\rfloor + 1 = 1 + 1 = 2 Hout=⌊24−2+0⌋+1=⌊22⌋+1=1+1=2
W o u t = ⌊ 4 − 2 + 0 2 ⌋ + 1 = ⌊ 2 2 ⌋ + 1 = 1 + 1 = 2 W{out} = \left\lfloor \frac{4 - 2 + 0}{2} \right\rfloor + 1 = \left\lfloor \frac{2}{2} \right\rfloor + 1 = 1 + 1 = 2 Wout=⌊24−2+0⌋+1=⌊22⌋+1=1+1=2

因此,池化之后的输出特征图大小是 ( 2 × 2 ) (2 \times 2) (2×2)。

具体示例

假设输入特征图如下:

1 3 2 4 5 6 7 8 9 2 4 6 3 1 0 5 \] \\begin{bmatrix} 1 \& 3 \& 2 \& 4 \\\\ 5 \& 6 \& 7 \& 8 \\\\ 9 \& 2 \& 4 \& 6 \\\\ 3 \& 1 \& 0 \& 5 \\end{bmatrix} 1593362127404865 ###### 最大池化操作的结果将是: \[ \[ 6 8 9 6 \] \] \[ \\begin{bmatrix} 6 \& 8 \\\\ 9 \& 6 \\end{bmatrix} \] \[\[6986\]

步骤:
  • 取左上角的 ( 2 × 2 ) (2 \times 2) (2×2) 区域 ( [ 1 3 5 6 ] ) (\begin {bmatrix} 1 & 3 \\ 5 & 6 \end{bmatrix}) ([1536]),最大值是6。
  • 移动窗口至右上角 ( [ 2 4 7 8 ] ) (\begin{bmatrix} 2 &4 \\ 7 & 8 \end{bmatrix}) ([2748]),最大值是8。
  • 移动窗口至左下角 ( [ 9 2 3 1 ] ) (\begin{bmatrix} 9 &2 \\ 3 & 1 \end{bmatrix}) ([9321]),最大值是9。
  • 移动窗口至右下角 ( [ 4 6 0 5 ] ) (\begin{bmatrix} 4 & 6 \\ 0 & 5 \end{bmatrix}) ([4065]),最大值是6。
最终得到输出特征图:

6 8 9 6 \] \\begin{bmatrix} 6 \&8 \\\\ 9 \& 6 \\end{bmatrix} \[6986

通过以上计算和示例,明确了池化操作之后的特征图大小计算方法和具体操作过程。

相关推荐
资讯分享周几秒前
扣子空间PPT生产力升级:AI智能生成与多模态创作新时代
人工智能·powerpoint
叶子爱分享1 小时前
计算机视觉与图像处理的关系
图像处理·人工智能·计算机视觉
鱼摆摆拜拜1 小时前
第 3 章:神经网络如何学习
人工智能·神经网络·学习
一只鹿鹿鹿1 小时前
信息化项目验收,软件工程评审和检查表单
大数据·人工智能·后端·智慧城市·软件工程
张较瘦_1 小时前
[论文阅读] 人工智能 | 深度学习系统崩溃恢复新方案:DaiFu框架的原位修复技术
论文阅读·人工智能·深度学习
cver1231 小时前
野生动物检测数据集介绍-5,138张图片 野生动物保护监测 智能狩猎相机系统 生态研究与调查
人工智能·pytorch·深度学习·目标检测·计算机视觉·目标跟踪
学技术的大胜嗷2 小时前
离线迁移 Conda 环境到 Windows 服务器:用 conda-pack 摆脱硬路径限制
人工智能·深度学习·yolo·目标检测·机器学习
还有糕手2 小时前
西南交通大学【机器学习实验10】
人工智能·机器学习
江瀚视野2 小时前
百度文心大模型4.5系列正式开源,开源会给百度带来什么?
人工智能
聚铭网络2 小时前
案例精选 | 某省级税务局AI大数据日志审计中台应用实践
大数据·人工智能·web安全