深度学习J7周 对于ResNeXt-50算法的思考

需要解决的疑问:代码是否有误?对错与否给出思考。

打卡要求:请查找相关资料、逐步推理模型、详细写下思考过程

问题:如果conv_shortcut=False,那么执行"x=Add()..."语句时,通道数不一致,为什么不会报错

因为在ResNext50整个模型中,在定义残差单元的时候,将conv_shortcut=False,表示使用identity_shortcut而不是Conv2D层作为快捷链接。

对于定义残差单元block模块,Add()是x和shortcut的加和,x通道数是filters*2.

对于shortcut、conv_shortcut=True则是filters*2,filters*2,否则是原始输入通道数。

对于堆叠残块模块stack模块,第二次调用block,conv_shortcut=False,使用identity_shortcut,这种情况,快捷连接将直接传递输入x给块的最后一层,因此,在执行"x=Add()",快捷连接通道数与该层不一致,但Add()在通道数不同时,会自动对快捷连接进行零填充,所以不会出现不匹配的错误。

相关推荐
Qdgr_15 分钟前
电厂数据库未来趋势:时序数据库 + AI 驱动的自优化系统
数据库·人工智能·时序数据库
知舟不叙1 小时前
基于OpenCV的人脸识别:LBPH算法
人工智能·opencv·人脸检测·lbph算法
乌恩大侠1 小时前
【东枫科技】使用LabVIEW进行NVIDIA CUDA GPU 开发
人工智能·科技·labview·nvidia·usrp
Silence4Allen1 小时前
RagFlow 完全指南(一):从零搭建开源大模型应用平台(Ollama、VLLM本地模型接入实战)
人工智能·大模型·rag·ragflow
music&movie1 小时前
手写系列——transformer网络完成加法和字符转译任务
网络·人工智能·transformer
梭七y2 小时前
记录学习《手动学习深度学习》这本书的笔记(十一)
笔记·深度学习·学习
白熊1882 小时前
【计算机视觉】OpenCV实战项目:FunnyMirrors:基于OpenCV的实时哈哈镜效果实现技术解析
人工智能·opencv·计算机视觉
Joern-Lee3 小时前
机器学习极简入门:从基础概念到行业应用
人工智能·机器学习
china10003 小时前
大模型系列(四)--- GPT2: Language Models are Unsupervised Multitask Learners
人工智能·深度学习
Jamence3 小时前
多模态大语言模型arxiv论文略读(六十二)
人工智能·语言模型·自然语言处理