107_PyTorch 实战:深度解析 nn.Conv2d 卷积层参数与应用

在理解了卷积的数学原理后,我们需要掌握如何在 PyTorch 代码中具体实现它。nn.Conv2d 是构建卷积神经网络(CNN)最频繁使用的模块。本篇将详细拆解其核心参数,并通过实战代码展示其对图像维度的影响。

1. 卷积层的分类

PyTorch 提供了不同维度的卷积工具,以适配不同的数据类型:

  • Conv1d:一维卷积,常用于序列数据(如文本、音频)。
  • Conv2d:二维卷积,标准工具,用于处理图像数据。
  • Conv3d:三维卷积,用于处理视频序列或医学影像(如 CT 扫描)。

2. 深入理解 nn.Conv2d 的核心参数

110_卷积层.ipynb 中,重点介绍了以下几个决定卷积效果的关键参数:

  • in_channels:输入通道数(如 RGB 图像为 3)。
  • out_channels :输出通道数。它代表了卷积核(滤波器)的个数,每个卷积核会提取一种特征。
  • kernel_size :卷积核的大小。定义为 3 代表 3*3。在训练过程中,卷积核内部的数值会自动调整,但尺寸是预设好的。
  • stride (步长) :卷积核滑动的快慢。默认是 1
  • padding (填充):在图片四周补 0 的层数,用于控制输出尺寸。

3.维度计算公式:输出图片多大?这是卷积层使用中最核心的数学问题。

给定输入尺寸,输出尺寸 的计算公式如下:

提示:如果计算结果不是整数,PyTorch 默认会向下取整(floor)。


4. 实战代码:观察图像的变化

文件通过代码演示了如何将一个简单的 5x5 矩阵经过卷积层处理:

Python

复制代码
import torch
import torch.nn as nn

# 1. 模拟输入数据:BatchSize=1, Channel=1, 高=5, 宽=5
input = torch.tensor([[1, 2, 0, 3, 1],
                      [0, 1, 2, 3, 1],
                      [1, 2, 1, 0, 0],
                      [5, 2, 3, 1, 1],
                      [2, 1, 0, 1, 1]], dtype=torch.float32)
input = torch.reshape(input, (1, 1, 5, 5))

# 2. 定义卷积层
# 输入1通道,输出1通道,卷积核3x3,步长1,无填充
conv = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=3, stride=1, padding=0)

# 3. 前向传播
output = conv(input)
print(output.shape) # 结果为 torch.Size([1, 1, 3, 3])

5. 总结:卷积层的"学习"本质

我们应该理解到:

  1. 参数化:卷积层中的卷积核(Kernel)是具有参数的,网络通过反向传播来学习这些参数,从而使其能够识别出有用的特征。
  2. 降维与特征提取 :通过调整 stridekernel_size,卷积层在提取特征的同时,通常也会减小图像的宽高,从而降低后续计算的复杂度。
相关推荐
GeeLark2 分钟前
TikTok自动化 我们有在优化
人工智能
秦时星星4 分钟前
Spring AI + FastMCP 跨语言集成踩坑实录
java·人工智能·spring
码农小白AI4 分钟前
单据审核难度大?IACheck AI 报告审核联动全流程高效核验
人工智能
聚城云-GeecityCloud4 分钟前
数字化破局|不分物业规模,皆可全新升级
大数据·人工智能
小白考证进阶中5 分钟前
阿里云ACA大模型|6月15日课程和大纲大改⚠️
人工智能·阿里云·阿里云认证·阿里云acp备考·阿里云aca证书·ai证书·阿里云aca大模型
Esaka_Forever9 分钟前
FAISS (Facebook AI Similarity Search)
人工智能·faiss
摄影图9 分钟前
[图片素材]大模型训练开发 场景覆盖适配各类科技
人工智能·科技·aigc·贴图
CSND74011 分钟前
零基础学Python合集---3:字符串的定义和常用方法
人工智能·python
数据堂官方账号12 分钟前
数据上新|覆盖全双工、具身智能、世界模型等热门研究趋势
人工智能·大模型·具身智能
LienJack21 分钟前
《Re0 Build Harness》第二章Agent 组成模型:Model、Loop、Tools、State
人工智能·agent