ResNet学习笔记

一、residual结构

优点:
(1)超深的网络结构(突破1000层)
(2)提出residual模块
(3)使用Batch Normalization加速训练(丢弃dropout)
解决问题:
(1) 梯度消失和梯度爆炸
(2) 退化问题,即层数深效果反而不好
右图对比左图, 可以减少计算的参数
二、

option B 可以使实线部分的输入矩阵和输出矩阵shape不同
三、Batch Normalization

四、网络结构图

相关推荐
叁两11 分钟前
用opencode打造全自动公众号写作流水线,AI 代笔太香了!
前端·人工智能·agent
前端付豪26 分钟前
LangChain记忆:通过Memory记住上次的对话细节
人工智能·python·langchain
strayCat2325527 分钟前
Clawdbot 源码解读 7: 扩展机制
人工智能·开源
王鑫星29 分钟前
SWE-bench 首次突破 80%:Claude Opus 4.5 发布,Anthropic 的野心不止于写代码
人工智能
lnix36 分钟前
当“大龙虾”养在本地:我们离“反SaaS”的AI未来还有多远?
人工智能·aigc
泉城老铁40 分钟前
Dify知识库如何实现多关键词AND检索?
人工智能
阿星AI工作室43 分钟前
给openclaw龙虾造了间像素办公室!实时看它写代码、摸鱼、修bug、写日报,太可爱了吧!
前端·人工智能·设计模式
Halo咯咯44 分钟前
别再学写代码了,顶级工程师现在在学管理AI agent | 值得一读
人工智能
明明如月学长1 小时前
被 Claude Code 劝退?这款免费开源好用的 AI 神器更适合普通人
人工智能