PyTorch深度学习实践——卷积神经网络高级篇

学习笔记|B 站 UP 主 刘二大人 《PyTorch深度学习实践》视频知识点总结

附上源代码
传送门 PyTorch深度学习实践------卷积神经网络高级篇

1. 1×1 卷积

在卷积神经网络(CNN)的设计中,1×1 卷积(1×1 Convolution)是一个极其精巧且至关重要的操作。以图中 Inception 模块的结构为例。

1×1 卷积的本质是使用尺寸为 1 × 1 1 \times 1 1×1 的卷积核进行运算。其核心创新在于突破了空间维度的限制 ,转而专注于通道维度 的特征变换。在图中的模块里,1×1 卷积(输出通道数为16)被巧妙地部署在 3×3、5×5 等大尺寸卷积之前,承担起降维与升维的双重角色:

  • 计算降维:通过将输入通道数从高维压缩至 16 个,它大幅减少了后续大卷积核(如 3×3、5×5)的输入通道数。这直接削减了绝大部分的乘法与加法运算量,让深层网络在保证特征提取能力的同时,避免了计算资源的急剧膨胀。
  • 跨通道融合:在降维的同时,1×1 卷积通过对每个像素位置上的所有输入通道进行线性加权组合,强制学习了通道间的关联信息,实现了高效的特征融合。

除此之外,1×1 卷积还是现代网络架构的核心组件:它可以灵活地增减特征图的通道数以适配网络容量,配合激活函数引入非线性,更作为瓶颈层广泛应用于 ResNet、MobileNet 等高效网络中。它用极小的计算代价,实现了特征通道的精准调控,是构建轻量化、高扩展性 CNN 的不可或缺的技术基石。

2. Inception 模块

Inception 模块的核心思想是通过并行的多分支结构,同时提取不同尺度的特征,最终通过通道拼接(Concatenate)融合成更丰富的特征表示。它巧妙地利用了 1×1 卷积这一关键技术,在保证特征多样性的同时,极大地提升了网络的计算效率。

模块内部包含四个并行分支:

  • 池化分支:先对输入进行平均池化,再通过 1×1 卷积进行通道变换,用于捕捉全局平均特征。
  • 单 1×1 卷积分支:直接使用 1×1 卷积进行轻量级的跨通道信息融合,以极低的计算成本实现特征变换。
  • 5×5 卷积分支:先用 1×1 卷积降维,再通过 5×5 卷积提取大尺度特征。1×1 卷积在这里扮演了"瓶颈层"的角色,大幅降低了后续大卷积的计算量。
  • 3×3 卷积堆叠分支:先用 1×1 卷积降维,再连续使用两个 3×3 卷积。这一设计用两个 3×3 卷积等效替代了一个 5×5 卷积,在减少参数量的同时,增加了网络的非线性表达能力。

3.Concatenate 融合

四个分支的输出特征张量(对应不同颜色的立方体形态)在通道维度上进行 Concatenate(拼接)操作,最终合并为一个统一的高维特征张量。

将不同分支学习到的多尺度特征(全局特征、细粒度特征、大感受野特征等)整合在一起,让后续网络层能够同时利用多种维度的特征信息,大幅提升特征的丰富度与表达能力。

相关推荐
碳基硅坊5 分钟前
在昇腾 910B2 上部署 Qwen3.5-35B-A3B
人工智能
冬奇Lab1 小时前
一天一个开源项目(第68篇):DeerFlow - 字节跳动出品的深度研究与超级智能体框架
人工智能·开源·资讯
NineData1 小时前
NineData V5.0 产品发布会:让 AI 成为数据管理的驱动力,4月16日!
数据库·人工智能·ai编程
罗西的思考1 小时前
【OpenClaw】通过 Nanobot 源码学习架构---(5)Context
人工智能·算法·机器学习
2301_764441332 小时前
claw-code:基于Claude Code架构的clean-room重写开源项目
人工智能·架构·开源
模拟器连接器曾工2 小时前
CCD定位与图像辨别的智能视觉检测系统
人工智能·计算机视觉·视觉检测·智能视觉检测系统
云栖梦泽2 小时前
AI安全合规与治理:行业发展趋势与职业展望
大数据·人工智能·安全
小陈工2 小时前
2026年4月2日技术资讯洞察:数据库融合革命、端侧AI突破与脑机接口产业化
开发语言·前端·数据库·人工智能·python·安全
happyprince3 小时前
2026年04月07日热门模型
人工智能
IT_陈寒3 小时前
Vue的这个响应式问题,坑了我整整两小时
前端·人工智能·后端