【跟马少平老师学AI】-【神经网络是怎么实现的】(五)梯度消失问题

一句话归纳:
1)用sigmoid激活函数时,BP算法更新公式为:

用sigmoid函数,O取值为0~1,O(1-O)最大值为0.25,若神经网络层数多,则会造成更新项趋近于0,称为梯度消失。

2)GooLeNet解决梯度消失的问题:

  • 在不同的深度构造了3个输出。
  • inception模块:
  • 其中,1*1卷积起到改变维度的作用,减少参数个数,比如,输入为192个通道,经过32个1*1卷积核运算,即可以将通道数降为32。

3)神经网络并不完全随着深度的增加提高正确率。

4)残差网络(ResNet):

残差块:

  • 通过恒等映射,梯度无衰减传递,消除梯度消失。
  • 解决网络退化问题。
  • 虚线恒等映射,在恒等映射的基础上,加个卷积层,以和F(X)同等大小、同样通道数的映射。
  • 全局平均池化层,经过池化,每个通道变成一个平均数。
相关推荐
ai大模型中转api测评2 分钟前
GPT-5.4 vs Gemini 3.1 Pro vs Qwen3.5-Omni:谁才是2026年最强的全能大模型?
人工智能·gpt
programhelp_3 分钟前
SIG 2026 Quant / Susquehanna OA 全攻略
人工智能·机器学习·面试·职场和发展·数据分析
环黄金线HHJX.10 分钟前
【吧里BaLi社区】
开发语言·人工智能·qt·编辑器
IT大师兄吖11 分钟前
IOPaint 开源ai去水印 去除背景 懒人整合包
人工智能
陈天伟教授16 分钟前
智能体架构:大语言模型驱动的自主系统深度解析与演进研究(二)
人工智能·语言模型·架构
world-wide-wait17 分钟前
机器学习04——numpy
人工智能·机器学习·numpy
北巷`19 分钟前
OpenClaw 源码架构与设计理念深度解析
人工智能·架构
kyle~22 分钟前
计算机视觉---Open3D数据处理库
人工智能·计算机视觉
SENKS_DIGITAL33 分钟前
立体环保展厅:绘就企业绿色梦想新画卷-森克思科技
人工智能·科技·设计·艺术·展厅设计·展览设计·数字科技展览设计
程序员Shawn35 分钟前
【深度学习 | 第一篇】- Pytorch与张量
人工智能·pytorch·深度学习