ResNet学习笔记

一、residual结构

优点:
(1)超深的网络结构(突破1000层)
(2)提出residual模块
(3)使用Batch Normalization加速训练(丢弃dropout)
解决问题:
(1) 梯度消失和梯度爆炸
(2) 退化问题,即层数深效果反而不好
右图对比左图, 可以减少计算的参数
二、

option B 可以使实线部分的输入矩阵和输出矩阵shape不同
三、Batch Normalization

四、网络结构图

相关推荐
Simon_lca几秒前
突破合规瓶颈:ZDHC Supplier to Zero(工厂零排放 - 进阶型)体系全攻略
大数据·网络·人工智能·分类·数据挖掘·数据分析·零售
卧蚕土豆13 分钟前
【有啥问啥】Claude Code 安装与使用教程
人工智能
Edward1111111117 分钟前
3.18异常学习
学习
刀法如飞20 分钟前
AI编程时代,为什么35岁以上程序员会更吃香?
人工智能·后端·ai编程
observe10130 分钟前
输入输出1
笔记
yukai0800832 分钟前
【203篇系列】050 关于量化的一些思考
人工智能
正经人_x1 小时前
学习日记34:UNETR
学习
罗小罗同学1 小时前
哈工大团队联合德累斯顿工业大学联合发布医学AI智能体综述,讲述计算病理如何从图像分类任务演变成自主诊段工作流
人工智能·分类·数据挖掘·医学图像处理·医学人工智能·医工交叉·医学ai
科技林总1 小时前
【系统分析师】12.3 软件架构描述与表示
学习
wincheshe1 小时前
AI Agent 开发学习 --- 框架开发实践(三)
人工智能·学习