ResNet学习笔记

一、residual结构

优点:
(1)超深的网络结构(突破1000层)
(2)提出residual模块
(3)使用Batch Normalization加速训练(丢弃dropout)
解决问题:
(1) 梯度消失和梯度爆炸
(2) 退化问题,即层数深效果反而不好
右图对比左图, 可以减少计算的参数
二、

option B 可以使实线部分的输入矩阵和输出矩阵shape不同
三、Batch Normalization

四、网络结构图

相关推荐
长桥夜波6 分钟前
机器学习日报21
人工智能·机器学习
rchmin15 分钟前
Prompt Engineering 从入门到精通的系统学习路径
人工智能·学习·prompt
ACE198521 分钟前
AI Agent 设计模式深度解析:提示链(Prompt Chaining)模式
人工智能·设计模式·prompt
AndrewHZ22 分钟前
【图像处理基石】如何使用大模型进行图像处理工作?
图像处理·人工智能·深度学习·算法·llm·stablediffusion·可控性
AndrewHZ26 分钟前
【图像处理基石】图像处理的基础理论体系介绍
图像处理·人工智能·算法·计算机视觉·cv·理论体系
人邮异步社区39 分钟前
如何有效地利用AI辅助编程,提高编程效率?
人工智能·深度学习·ai编程
许泽宇的技术分享1 小时前
当AI Agent遇上.NET:微软Agent Framework的架构奥秘与实战启示
人工智能·microsoft·.net
江苏世纪龙科技1 小时前
开启汽车实训新视界:大众迈腾整车检测与诊断MR仿真实训系统
学习
爱笑的眼睛111 小时前
PyTorch Lightning:重新定义深度学习工程实践
java·人工智能·python·ai