CNN(七):ResNeXt-50算法的思考

在进行ResNeXt-50实战练习时,我也跟其他学员一样有这个疑惑,如下图所示:

反复查看代码,仍然有些疑惑,甚至怀疑是不是代码错了。实践是检验真理的唯一标准,先把代码跑起来再说。发现运行完全没有问题,再通过对比查看网络结构和代码后,搞清楚了原因,根本原因就在stack的设计,即一个conv_shortcut=True的block+n个conv_shortcut=False的堆叠残差单元,如下图所示:

下面以filters=128,blocks=2的入参来说明原因。

(1)1个block(conv_shortcut=True):conv_shortcut=True,结合代码可知,在进行Add操作时,是将进行了Conv+BN操作的特征图(filters=2*128),与后续[(Conv+BN+ReLU)+ 分组卷积 + (Conv+BN) ]的一系列操作后得出的特征图(filters=2*128)进行Add操作,此时Add的两部分的通道数均是2*128,即256,之后再进行ReLU操作;

(2)2个block(conv_shortcut=False):conv_shortcut=False,结合代码可知,在进行Add操作时,是直接对输入的x与后续的[(Conv+BN+ReLU)+ 分组卷积 + (Conv+BN) ]的一系列操作后得出的特征图(filters=2*128)进行Add操作。这里为什么add的其中一部分是输入x,是因为此时的输入x,是已经通过上面的1个block操作了,此时x的通道数原本就是2*128,即256。因此在进行Add操作时,与后续得出的特征图(filters=2*128)在通道数上完美匹配。

其他filters=256、512、1024则是类似的操作。

相关推荐
中科岩创几秒前
陕西某地煤矿铁塔自动化监测服务项目
人工智能·物联网·自动化
亚马逊云开发者4 分钟前
Agentic AI基础设施实践经验系列(三):Agent记忆模块的最佳实践
人工智能
小花皮猪7 分钟前
多模态 AI 时代的数据困局与机遇,Bright Data 赋能LLM 训练以及AEO场景
人工智能·多模态·ai代理·aeo
爱吃烤鸡翅的酸菜鱼15 分钟前
深度解析《AI+Java编程入门》:一本为零基础重构的Java学习路径
java·人工智能·后端·ai
snakecy18 分钟前
智能家居技术发展与应用综述
人工智能·区块链
飞哥数智坊19 分钟前
实测 TRAE SOLO 新模型:半小时搓出一个能用的抽奖系统
人工智能·trae·solo
Juchecar34 分钟前
母语,塑造和构成了我们的思维过程本身
人工智能
苏打水com40 分钟前
0基础学前端:100天拿offer实战课(第3天)—— CSS基础美化:给网页“精装修”的5大核心技巧
人工智能·python·tensorflow
NON-JUDGMENTAL1 小时前
CyberSecEval 2
人工智能
智驱力人工智能1 小时前
智能安全管理 基于视觉分析的玩手机检测系统 手机行为AI模型训练 边缘计算手机行为监测设备
人工智能·安全·目标检测·计算机视觉·智能手机·视觉检测·边缘计算