PyTorch卷积层填充(Padding)与步幅(Stride)详解及代码示例

本文通过具体代码示例讲解PyTorch中卷积操作的填充(Padding) 和**步幅(Stride)**对输出形状的影响,帮助读者掌握卷积层的参数配置技巧。


一、填充与步幅基础

  • 填充(Padding):在输入数据边缘添加指定数量的像素,用于控制输出尺寸的大小。

  • 步幅(Stride):卷积核在输入数据上每次滑动的步长,用于控制输出尺寸的缩小比例。

输出尺寸计算公式:

二、代码实现与示例

1. 全侧边填充1个像素

python 复制代码
import torch
from torch import nn

def comp_conv2d(conv2d, x):
    x = x.reshape((1, 1) + x.shape)  # 增加批次和通道维度
    y = conv2d(x)                    # 计算卷积
    return y.reshape(y.shape[2:])    # 删除批次和通道维度

# 创建卷积层:3x3卷积核,填充1像素
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1)
x = torch.rand((8, 8))               # 8x8输入矩阵
comp_conv2d(conv2d, x).shape         # 输出形状

输出结果

bash 复制代码
torch.Size([8, 8])

解析:填充1像素后,输入尺寸保持不变。


2. 非对称填充(高度和宽度不同)

python 复制代码
# 创建卷积层:5x3卷积核,高度填充2,宽度填充1
conv2d = nn.Conv2d(1, 1, kernel_size=(5, 3), padding=(2, 1))
comp_conv2d(conv2d, x).shape

输出结果

bash 复制代码
torch.Size([8, 8])

3. 步幅设置为2

python 复制代码
# 创建卷积层:3x3卷积核,填充1,步幅2
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1, stride=2)
comp_conv2d(conv2d, x).shape

输出结果

bash 复制代码
torch.Size([4, 4])

4. 复杂参数组合

python 复制代码
# 创建卷积层:3x5卷积核,高度不填充,宽度填充1,步幅(3,4)
conv2d = nn.Conv2d(1, 1, kernel_size=(3, 5), padding=(0, 1), stride=(3, 4))
comp_conv2d(conv2d, x).shape

输出结果

bash 复制代码
torch.Size([2, 2])

三、总结

  1. 填充用于保持输入输出尺寸一致或调整边缘特征保留。

  2. 步幅用于降低输出尺寸,减少计算量。

  3. 通过组合不同参数,可灵活控制卷积层的输出形状。

建议读者通过修改参数自行实验,深入理解公式中的数值变化规律。

相关推荐
这张生成的图像能检测吗15 小时前
(论文速读)EfficientTrain++: 高效视觉骨干训练的通用课程学习
人工智能·深度学习·计算机视觉·训练方法
晚霞的不甘16 小时前
CANN:华为全栈AI计算框架的深度解析(终极扩展版 · 完整篇)
人工智能·华为
DanCheng-studio17 小时前
网安毕业设计简单的方向答疑
python·毕业设计·毕设
轻抚酸~18 小时前
KNN(K近邻算法)-python实现
python·算法·近邻算法
lisw0518 小时前
6G频段与5G频段有何不同?
人工智能·机器学习
独行soc19 小时前
2025年渗透测试面试题总结-264(题目+回答)
网络·python·安全·web安全·网络安全·渗透测试·安全狮
2501_9416233220 小时前
人工智能赋能智慧农业互联网应用:智能种植、农业数据分析与产量优化实践探索》
大数据·人工智能
不爱吃糖的程序媛20 小时前
华为 CANN:昇腾 AI 的异构计算架构核心与开源生态解析
人工智能·华为·架构
汤姆yu20 小时前
基于python的外卖配送及数据分析系统
开发语言·python·外卖分析