CNN(七):ResNeXt-50算法的思考

在进行ResNeXt-50实战练习时,我也跟其他学员一样有这个疑惑,如下图所示:

反复查看代码,仍然有些疑惑,甚至怀疑是不是代码错了。实践是检验真理的唯一标准,先把代码跑起来再说。发现运行完全没有问题,再通过对比查看网络结构和代码后,搞清楚了原因,根本原因就在stack的设计,即一个conv_shortcut=True的block+n个conv_shortcut=False的堆叠残差单元,如下图所示:

下面以filters=128,blocks=2的入参来说明原因。

(1)1个block(conv_shortcut=True):conv_shortcut=True,结合代码可知,在进行Add操作时,是将进行了Conv+BN操作的特征图(filters=2*128),与后续[(Conv+BN+ReLU)+ 分组卷积 + (Conv+BN) ]的一系列操作后得出的特征图(filters=2*128)进行Add操作,此时Add的两部分的通道数均是2*128,即256,之后再进行ReLU操作;

(2)2个block(conv_shortcut=False):conv_shortcut=False,结合代码可知,在进行Add操作时,是直接对输入的x与后续的[(Conv+BN+ReLU)+ 分组卷积 + (Conv+BN) ]的一系列操作后得出的特征图(filters=2*128)进行Add操作。这里为什么add的其中一部分是输入x,是因为此时的输入x,是已经通过上面的1个block操作了,此时x的通道数原本就是2*128,即256。因此在进行Add操作时,与后续得出的特征图(filters=2*128)在通道数上完美匹配。

其他filters=256、512、1024则是类似的操作。

相关推荐
新缸中之脑16 分钟前
AI工程师成长路线图 (2026)
人工智能
商业数据派16 分钟前
快手估值重构的“隐藏彩蛋”
大数据·人工智能·重构
新缸中之脑19 分钟前
你的智能体技术栈中缺失的层
大数据·人工智能·数据挖掘
呆呆敲代码的小Y25 分钟前
UnityMCP+Claude+VSCode,构建最强AI游戏开发环境
人工智能·vscode·游戏·unity·游戏引擎·u3d·mcp
balmtv33 分钟前
Claude 3.5镜像深度推理实战:用AI破解复杂逻辑谜题与数学证明
人工智能
BPM66644 分钟前
2026 AI流程管理软件选型:从BPM到iBPM,如何构建可分析、可优化、可执行的流程平台
人工智能
wggmrlee1 小时前
AI技术架构全局视角
人工智能·架构
peachSoda71 小时前
前端想转AI全栈-初步练习记录
前端·人工智能
福客AI智能客服2 小时前
电商AI客服:自动客服机器人如何成为企业效率提升的关键
人工智能·机器人
Data-Miner2 小时前
46页精品PPT | AI智能中台企业架构设计_重新定义制造
人工智能·制造