PyTorch深度学习实践——卷积神经网络高级篇

学习笔记|B 站 UP 主 刘二大人 《PyTorch深度学习实践》视频知识点总结

附上源代码
传送门 PyTorch深度学习实践------卷积神经网络高级篇

1. 1×1 卷积

在卷积神经网络(CNN)的设计中,1×1 卷积(1×1 Convolution)是一个极其精巧且至关重要的操作。以图中 Inception 模块的结构为例。

1×1 卷积的本质是使用尺寸为 1 × 1 1 \times 1 1×1 的卷积核进行运算。其核心创新在于突破了空间维度的限制 ,转而专注于通道维度 的特征变换。在图中的模块里,1×1 卷积(输出通道数为16)被巧妙地部署在 3×3、5×5 等大尺寸卷积之前,承担起降维与升维的双重角色:

  • 计算降维:通过将输入通道数从高维压缩至 16 个,它大幅减少了后续大卷积核(如 3×3、5×5)的输入通道数。这直接削减了绝大部分的乘法与加法运算量,让深层网络在保证特征提取能力的同时,避免了计算资源的急剧膨胀。
  • 跨通道融合:在降维的同时,1×1 卷积通过对每个像素位置上的所有输入通道进行线性加权组合,强制学习了通道间的关联信息,实现了高效的特征融合。

除此之外,1×1 卷积还是现代网络架构的核心组件:它可以灵活地增减特征图的通道数以适配网络容量,配合激活函数引入非线性,更作为瓶颈层广泛应用于 ResNet、MobileNet 等高效网络中。它用极小的计算代价,实现了特征通道的精准调控,是构建轻量化、高扩展性 CNN 的不可或缺的技术基石。

2. Inception 模块

Inception 模块的核心思想是通过并行的多分支结构,同时提取不同尺度的特征,最终通过通道拼接(Concatenate)融合成更丰富的特征表示。它巧妙地利用了 1×1 卷积这一关键技术,在保证特征多样性的同时,极大地提升了网络的计算效率。

模块内部包含四个并行分支:

  • 池化分支:先对输入进行平均池化,再通过 1×1 卷积进行通道变换,用于捕捉全局平均特征。
  • 单 1×1 卷积分支:直接使用 1×1 卷积进行轻量级的跨通道信息融合,以极低的计算成本实现特征变换。
  • 5×5 卷积分支:先用 1×1 卷积降维,再通过 5×5 卷积提取大尺度特征。1×1 卷积在这里扮演了"瓶颈层"的角色,大幅降低了后续大卷积的计算量。
  • 3×3 卷积堆叠分支:先用 1×1 卷积降维,再连续使用两个 3×3 卷积。这一设计用两个 3×3 卷积等效替代了一个 5×5 卷积,在减少参数量的同时,增加了网络的非线性表达能力。

3.Concatenate 融合

四个分支的输出特征张量(对应不同颜色的立方体形态)在通道维度上进行 Concatenate(拼接)操作,最终合并为一个统一的高维特征张量。

将不同分支学习到的多尺度特征(全局特征、细粒度特征、大感受野特征等)整合在一起,让后续网络层能够同时利用多种维度的特征信息,大幅提升特征的丰富度与表达能力。

相关推荐
knighthood20011 小时前
protobuf和gazebo的一些绑定
人工智能·机器人·自动驾驶
瑞华丽PLM2 小时前
通用与专业PLM选型对比 (1)
大数据·人工智能·plm·瑞华丽plm·瑞华丽
再一次等风来2 小时前
深度学习中的梯度消失与梯度爆炸
人工智能·深度学习·梯度
程序员海军2 小时前
深度测评:在微信里直接操控 OpenClaw
人工智能·后端
翘着二郎腿的程序猿2 小时前
2026最全免费AI数据集平台清单|附官方地址+镜像+代码+截图指引
人工智能
沪漂阿龙2 小时前
语义搜索与RAG:让搜索引擎真正理解你的意图,让AI告别“幻觉”
人工智能·搜索引擎
悟纤2 小时前
OpenClaw 入门教程 | OpenClaw教程 | 第1篇
人工智能·ai agent·openclaw
leo_2322 小时前
SMP的第一个AI接口应用
人工智能·开发工具·smp(软件制作平台)·应用系统
ARVRCool编程训练营2 小时前
吴恩达2026 Agent智能体教程核心精讲:从设计模式到知识图谱的完整路线图
人工智能