PyTorch深度学习实践——卷积神经网络高级篇

学习笔记|B 站 UP 主 刘二大人 《PyTorch深度学习实践》视频知识点总结

附上源代码
传送门 PyTorch深度学习实践------卷积神经网络高级篇

1. 1×1 卷积

在卷积神经网络(CNN)的设计中,1×1 卷积(1×1 Convolution)是一个极其精巧且至关重要的操作。以图中 Inception 模块的结构为例。

1×1 卷积的本质是使用尺寸为 1 × 1 1 \times 1 1×1 的卷积核进行运算。其核心创新在于突破了空间维度的限制 ,转而专注于通道维度 的特征变换。在图中的模块里,1×1 卷积(输出通道数为16)被巧妙地部署在 3×3、5×5 等大尺寸卷积之前,承担起降维与升维的双重角色:

  • 计算降维:通过将输入通道数从高维压缩至 16 个,它大幅减少了后续大卷积核(如 3×3、5×5)的输入通道数。这直接削减了绝大部分的乘法与加法运算量,让深层网络在保证特征提取能力的同时,避免了计算资源的急剧膨胀。
  • 跨通道融合:在降维的同时,1×1 卷积通过对每个像素位置上的所有输入通道进行线性加权组合,强制学习了通道间的关联信息,实现了高效的特征融合。

除此之外,1×1 卷积还是现代网络架构的核心组件:它可以灵活地增减特征图的通道数以适配网络容量,配合激活函数引入非线性,更作为瓶颈层广泛应用于 ResNet、MobileNet 等高效网络中。它用极小的计算代价,实现了特征通道的精准调控,是构建轻量化、高扩展性 CNN 的不可或缺的技术基石。

2. Inception 模块

Inception 模块的核心思想是通过并行的多分支结构,同时提取不同尺度的特征,最终通过通道拼接(Concatenate)融合成更丰富的特征表示。它巧妙地利用了 1×1 卷积这一关键技术,在保证特征多样性的同时,极大地提升了网络的计算效率。

模块内部包含四个并行分支:

  • 池化分支:先对输入进行平均池化,再通过 1×1 卷积进行通道变换,用于捕捉全局平均特征。
  • 单 1×1 卷积分支:直接使用 1×1 卷积进行轻量级的跨通道信息融合,以极低的计算成本实现特征变换。
  • 5×5 卷积分支:先用 1×1 卷积降维,再通过 5×5 卷积提取大尺度特征。1×1 卷积在这里扮演了"瓶颈层"的角色,大幅降低了后续大卷积的计算量。
  • 3×3 卷积堆叠分支:先用 1×1 卷积降维,再连续使用两个 3×3 卷积。这一设计用两个 3×3 卷积等效替代了一个 5×5 卷积,在减少参数量的同时,增加了网络的非线性表达能力。

3.Concatenate 融合

四个分支的输出特征张量(对应不同颜色的立方体形态)在通道维度上进行 Concatenate(拼接)操作,最终合并为一个统一的高维特征张量。

将不同分支学习到的多尺度特征(全局特征、细粒度特征、大感受野特征等)整合在一起,让后续网络层能够同时利用多种维度的特征信息,大幅提升特征的丰富度与表达能力。

相关推荐
一点一木3 小时前
深度体验TRAE SOLO移动端7天:作为独立开发者,我把工作流揣进了兜里
前端·人工智能·trae
Lee川4 小时前
mini-cursor 揭秘:从 Tool 定义到 Agent 循环的完整实现
前端·人工智能·后端
weelinking4 小时前
【产品】00_产品经理用Claude实现产品系列介绍
数据库·人工智能·sql·数据挖掘·github·产品经理
Agent产品评测局4 小时前
制造业模具管理AI系统,主流产品能力对比详解:2026年智能制造选型深度洞察
人工智能·ai·chatgpt·制造
研华科技Advantech5 小时前
如何用一套实训设备,打通工业AI预测性维护技术全流程?
人工智能
Lab_AI5 小时前
AI for Science: MaXFlow AI Agent+ 报告体验双升级,让AI智能体更高效易用!
人工智能·ai for science·ai agent·ai智能体
李坤5 小时前
让 Codex 和 Claude 互相 Review:告别手动复制
人工智能·openai·claude
南屹川6 小时前
【API设计】GraphQL实战:从REST到GraphQL的演进
人工智能
KJ_BioMed6 小时前
当计算生物学遇上生成式AI:从头设计生物分子的“新范式”初探
人工智能·从头设计·生命科学·生物医药·科研干货·科晶生物
明月醉窗台6 小时前
深度学习(17)YOLO训练中的超参数详解
人工智能·深度学习·yolo