PyTorch深度学习实践——卷积神经网络高级篇

学习笔记|B 站 UP 主 刘二大人 《PyTorch深度学习实践》视频知识点总结

附上源代码
传送门 PyTorch深度学习实践------卷积神经网络高级篇

1. 1×1 卷积

在卷积神经网络(CNN)的设计中,1×1 卷积(1×1 Convolution)是一个极其精巧且至关重要的操作。以图中 Inception 模块的结构为例。

1×1 卷积的本质是使用尺寸为 1 × 1 1 \times 1 1×1 的卷积核进行运算。其核心创新在于突破了空间维度的限制 ,转而专注于通道维度 的特征变换。在图中的模块里,1×1 卷积(输出通道数为16)被巧妙地部署在 3×3、5×5 等大尺寸卷积之前,承担起降维与升维的双重角色:

  • 计算降维:通过将输入通道数从高维压缩至 16 个,它大幅减少了后续大卷积核(如 3×3、5×5)的输入通道数。这直接削减了绝大部分的乘法与加法运算量,让深层网络在保证特征提取能力的同时,避免了计算资源的急剧膨胀。
  • 跨通道融合:在降维的同时,1×1 卷积通过对每个像素位置上的所有输入通道进行线性加权组合,强制学习了通道间的关联信息,实现了高效的特征融合。

除此之外,1×1 卷积还是现代网络架构的核心组件:它可以灵活地增减特征图的通道数以适配网络容量,配合激活函数引入非线性,更作为瓶颈层广泛应用于 ResNet、MobileNet 等高效网络中。它用极小的计算代价,实现了特征通道的精准调控,是构建轻量化、高扩展性 CNN 的不可或缺的技术基石。

2. Inception 模块

Inception 模块的核心思想是通过并行的多分支结构,同时提取不同尺度的特征,最终通过通道拼接(Concatenate)融合成更丰富的特征表示。它巧妙地利用了 1×1 卷积这一关键技术,在保证特征多样性的同时,极大地提升了网络的计算效率。

模块内部包含四个并行分支:

  • 池化分支:先对输入进行平均池化,再通过 1×1 卷积进行通道变换,用于捕捉全局平均特征。
  • 单 1×1 卷积分支:直接使用 1×1 卷积进行轻量级的跨通道信息融合,以极低的计算成本实现特征变换。
  • 5×5 卷积分支:先用 1×1 卷积降维,再通过 5×5 卷积提取大尺度特征。1×1 卷积在这里扮演了"瓶颈层"的角色,大幅降低了后续大卷积的计算量。
  • 3×3 卷积堆叠分支:先用 1×1 卷积降维,再连续使用两个 3×3 卷积。这一设计用两个 3×3 卷积等效替代了一个 5×5 卷积,在减少参数量的同时,增加了网络的非线性表达能力。

3.Concatenate 融合

四个分支的输出特征张量(对应不同颜色的立方体形态)在通道维度上进行 Concatenate(拼接)操作,最终合并为一个统一的高维特征张量。

将不同分支学习到的多尺度特征(全局特征、细粒度特征、大感受野特征等)整合在一起,让后续网络层能够同时利用多种维度的特征信息,大幅提升特征的丰富度与表达能力。

相关推荐
GEO_NEWS9 小时前
2026年GEO选型全景透视:技术路径、适配场景与决策逻辑深度解析
人工智能·microsoft
147API9 小时前
Claude 工具调用场景梳理:从 MCP 到企业落地链路
人工智能·架构·api·claude
七夜zippoe9 小时前
OpenClaw 节点管理:设备与远程控制
人工智能·远程控制·设备·openclaw·节点管理
MaxCode-19 小时前
Chapter 9:企业实战案例与架构沉淀
人工智能·spring·架构
ai产品老杨9 小时前
【架构深研】如何构建兼容X86/ARM与异构算力的AI视频中台?基于GB28181与边缘计算的源码交付实践
arm开发·人工智能·架构
Agent手记9 小时前
生产节拍混乱,在制品积压严重该怎么破解?——2026制造业柔性生产与Agent自动化实战指南
运维·人工智能·ai·自动化
卷卷说风控9 小时前
【卷卷观察】Physical AI(具身智能)崛起 + 开源效率革命——AI正在从“数字“走向“物理“
人工智能·开源
财经资讯数据_灵砚智能9 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年4月28日
人工智能·python·信息可视化·自然语言处理·ai编程
爱看科技9 小时前
三星新一代智能眼镜率先亮相,微美全息多维度AI+AR场景体验驱动行业飞跃
人工智能·ar
Wanderer X9 小时前
【VLM】VQVAE
人工智能