深度学习J7周 对于ResNeXt-50算法的思考

需要解决的疑问:代码是否有误?对错与否给出思考。

打卡要求:请查找相关资料、逐步推理模型、详细写下思考过程

问题:如果conv_shortcut=False,那么执行"x=Add()..."语句时,通道数不一致,为什么不会报错

因为在ResNext50整个模型中,在定义残差单元的时候,将conv_shortcut=False,表示使用identity_shortcut而不是Conv2D层作为快捷链接。

对于定义残差单元block模块,Add()是x和shortcut的加和,x通道数是filters*2.

对于shortcut、conv_shortcut=True则是filters*2,filters*2,否则是原始输入通道数。

对于堆叠残块模块stack模块,第二次调用block,conv_shortcut=False,使用identity_shortcut,这种情况,快捷连接将直接传递输入x给块的最后一层,因此,在执行"x=Add()",快捷连接通道数与该层不一致,但Add()在通道数不同时,会自动对快捷连接进行零填充,所以不会出现不匹配的错误。

相关推荐
倔强青铜三几秒前
为什么 self 与 super() 成了 Python 的永恒痛点?
人工智能·python·面试
墨尘游子3 分钟前
目标导向的强化学习:问题定义与 HER 算法详解—强化学习(19)
人工智能·python·算法
go54631584651 小时前
中文语音识别与偏误检测系统开发
开发语言·人工智能·学习·生成对抗网络·数学建模·语音识别
贝塔西塔1 小时前
PytorchLightning最佳实践基础篇
pytorch·深度学习·lightning·编程框架
GG向前冲1 小时前
机器学习对中特估股票关键特征选取的应用与研究
人工智能·机器学习·投资组合
弥金1 小时前
LangChain基础
人工智能·后端
不摸鱼2 小时前
创业找不到方向?不妨从行业卧底开始 | 不摸鱼的独立开发者日报(第66期)
人工智能·开源·资讯
ReinaXue2 小时前
大模型【进阶】(五):低秩适配矩阵LORA的深度认识
人工智能·深度学习·神经网络·语言模型·自然语言处理·transformer
人生都在赌2 小时前
AI Agent从工具到生态的秘密:我们踩过的坑和3个月实践教训
人工智能·ci/cd·devops
北极的树2 小时前
大模型上下文工程之Prefix Caching技术详解
人工智能·ai编程