ResNet学习笔记

一、residual结构

优点:
(1)超深的网络结构(突破1000层)
(2)提出residual模块
(3)使用Batch Normalization加速训练(丢弃dropout)
解决问题:
(1) 梯度消失和梯度爆炸
(2) 退化问题,即层数深效果反而不好
右图对比左图, 可以减少计算的参数
二、

option B 可以使实线部分的输入矩阵和输出矩阵shape不同
三、Batch Normalization

四、网络结构图

相关推荐
老王熬夜敲代码几秒前
网路编程--协议
linux·网络·笔记
undsky_2 分钟前
n8n 重构镜像,开启无限可能
人工智能·ai·aigc·ai编程
北邮刘老师4 分钟前
智能体,超越人类与机器的世界“理解者”
网络·人工智能·大模型·智能体·智能体互联网
paopao_wu6 分钟前
声音克隆与情感合成:Dify接入IndexTTS2
人工智能·ai·tts
会挠头但不秃7 分钟前
深度学习常用工具和库介绍
人工智能·深度学习
Coder_Boy_13 分钟前
【人工智能应用技术】-基础实战-小程序应用(基于springAI+百度语音技术)智能语音控制
人工智能·小程序
用泥种荷花16 分钟前
智能体基础概念笔记
人工智能
雨大王51217 分钟前
智能研发体是否值得投入?3大维度对比传统模式
人工智能·汽车
寰天柚子19 分钟前
大模型时代的技术从业者:核心能力重构与实践路径
大数据·人工智能
智算菩萨21 分钟前
AI能否可持续:从“三支柱”到“可持续AI目标体系”的理论框架与核算逻辑
人工智能·可持续