【跟马少平老师学AI】-【神经网络是怎么实现的】(五)梯度消失问题

一句话归纳:
1)用sigmoid激活函数时,BP算法更新公式为:

用sigmoid函数,O取值为0~1,O(1-O)最大值为0.25,若神经网络层数多,则会造成更新项趋近于0,称为梯度消失。

2)GooLeNet解决梯度消失的问题:

  • 在不同的深度构造了3个输出。
  • inception模块:
  • 其中,1*1卷积起到改变维度的作用,减少参数个数,比如,输入为192个通道,经过32个1*1卷积核运算,即可以将通道数降为32。

3)神经网络并不完全随着深度的增加提高正确率。

4)残差网络(ResNet):

残差块:

  • 通过恒等映射,梯度无衰减传递,消除梯度消失。
  • 解决网络退化问题。
  • 虚线恒等映射,在恒等映射的基础上,加个卷积层,以和F(X)同等大小、同样通道数的映射。
  • 全局平均池化层,经过池化,每个通道变成一个平均数。
相关推荐
siliconstorm.ai1 小时前
OpenAI重组受阻:微软“锁链”与生态博弈
人工智能
Fabarta技术团队2 小时前
Fabarta个人专属智能体赋能媒体:从过载信息到深度可控的创作体系
人工智能·智能体
电气铺二表姐137744166153 小时前
【WIFI电表】物联网无线通讯光伏储能三相单相智能电表
运维·人工智能·能源
胶带码农3 小时前
机器学习-时序预测2
人工智能·机器学习
心动啊1214 小时前
神经网络2——使用Keras实现MLP
人工智能·深度学习·神经网络
stjiejieto4 小时前
教育 AI 的下半场:个性化学习路径生成背后,技术如何平衡效率与教育本质?
大数据·人工智能·学习
武子康4 小时前
AI-调查研究-65-机器人 机械臂控制技术的前世今生:从PLC到MPC
人工智能·ai·职场和发展·机器人·职场发展·个人开发·gp
vvilkim4 小时前
PyTorch自动微分(Autograd)原理与实践:让深度学习训练更高效
人工智能·pytorch·深度学习
BFT白芙堂4 小时前
松灵斯坦福Mobile ALOHA同款 | 通过低成本全身远程操作实现双手机器人移动操控学习
人工智能·学习·机器人·移动机器人·论文解读·开源双臂遥操作系统·松灵cobotmagic
陈佬昔没带相机4 小时前
用 Dify/Coze 定制企业级的 AI 问答助手
人工智能·开源·coze