365打卡第J7周:对于ResNeXt-50算法的思考

🏡 我的环境:

语言环境:Python3.10

编译器:Jupyter Lab

深度学习环境:torch==2.5.1 torchvision==0.20.1

------------------------------分割线---------------------------------

该代码定义了一个残差单元,包含以下部分:

  1. 捷径连接(shortcut)处理
  2. 主路径的三层卷积层结构
  3. 分组卷积的实现
  4. 最终的残差连接和激活

这部分代码在功能上没有问题,但有一个需要注意的点:

主路径的最后一层卷积输出通道数是filters * 2,这与捷径分支的通道数保持一致(当conv_shortcut=True时)。这是正确的设计,保证了两个分支可以相加。

分析一下潜在的通道数和尺寸匹配问题:

  1. conv_shortcut=True时:

    • shortcut分支:输出通道数为filters * 2
    • 主路径:最终输出通道数也为filters * 2
    • 尺寸变化:shortcut使用strides参数调整尺寸
  2. conv_shortcut=False时:

    • shortcut直接使用输入x
    • 则直接将输入张量 x 作为快捷连接。
    • 在这种情况下,即使通道数不一致也不会报错的可能原因如下:此时,shortcut 的维度不同于 x 的维度。但是,由于 Add 层具有广播机制,因此会自动对两个输入进行广播,以使它们的维度相同。这是因为 Add 层会在计算中使用广播机制,这使得在执行相加操作之前,较小张量的形状会被扩展以匹配较大张量的形状。具体来说,如果 shortcut 的形状是 (h, w, c1),x 的形状是 (h, w, c2),其中 c1 不等于 c2,则 shortcut 会被自动扩展为 (h, w, c2),使得 x 和 shortcut 的形状相同。因此,即使通道数不一致,也可以进行相加操作。
相关推荐
weixin_377634844 小时前
【K-S 检验】Kolmogorov–Smirnov计算过程与示例
人工智能·深度学习·机器学习
yaoh.wang4 小时前
力扣(LeetCode) 13: 罗马数字转整数 - 解法思路
python·程序人生·算法·leetcode·面试·职场和发展·跳槽
T1ssy4 小时前
布隆过滤器:用概率换空间的奇妙数据结构
算法·哈希算法
hetao17338375 小时前
2025-12-12~14 hetao1733837的刷题笔记
数据结构·c++·笔记·算法
小鸡吃米…5 小时前
Python PyQt6教程七-控件
数据库·python
1916zz5 小时前
Extreme programing 方利喆 _ 江贤晟
python
长安牧笛5 小时前
智能鞋柜—脚气终结者,内置温湿度传感器和紫外线灯,晚上回家,把鞋放进去,自动检测湿度,湿度超标就启动烘干+紫外线杀菌,第二天穿鞋干燥无异味。
python
鲨莎分不晴6 小时前
强化学习第五课 —— A2C & A3C:并行化是如何杀死经验回放
网络·算法·机器学习
weixin_457760006 小时前
PIL库将图片位深度是1、8、32统一转换为24的方法
python
搞科研的小刘选手6 小时前
【ISSN/ISBN双刊号】第三届电力电子与人工智能国际学术会议(PEAI 2026)
图像处理·人工智能·算法·电力电子·学术会议