【跟马少平老师学AI】-【神经网络是怎么实现的】(五)梯度消失问题

一句话归纳:
1)用sigmoid激活函数时,BP算法更新公式为:

用sigmoid函数,O取值为0~1,O(1-O)最大值为0.25,若神经网络层数多,则会造成更新项趋近于0,称为梯度消失。

2)GooLeNet解决梯度消失的问题:

  • 在不同的深度构造了3个输出。
  • inception模块:
  • 其中,1*1卷积起到改变维度的作用,减少参数个数,比如,输入为192个通道,经过32个1*1卷积核运算,即可以将通道数降为32。

3)神经网络并不完全随着深度的增加提高正确率。

4)残差网络(ResNet):

残差块:

  • 通过恒等映射,梯度无衰减传递,消除梯度消失。
  • 解决网络退化问题。
  • 虚线恒等映射,在恒等映射的基础上,加个卷积层,以和F(X)同等大小、同样通道数的映射。
  • 全局平均池化层,经过池化,每个通道变成一个平均数。
相关推荐
人工智能AI技术几秒前
【VibeCoding系列教程12】 AI代码编辑器
人工智能
zhangfeng11338 分钟前
ai训练 顿悟“总数据量是 m²,训练所需要的数据量是 log m
人工智能
半兽先生20 分钟前
05阶段:NLP自然语言处理基础
人工智能·自然语言处理
盈飞无限25 分钟前
SPC选型:智能VS传统,谁更懂中国制造?
人工智能·制造
li-xun25 分钟前
LINUX DO 社区注册机制调整与公益 AI 服务动态
linux·运维·人工智能
云烟成雨TD29 分钟前
Spring AI 1.x 系列【50】可观测性:接入 Prometheus + Grafana
人工智能·spring·prometheus
梦梦代码精1 小时前
为什么这个开源的AI平台会火?有点东西。。。
人工智能·算法·机器学习·docker·开源
大模型真好玩1 小时前
智能体从入门到精通:6个必学GitHub开源项目
人工智能·agent·deepseek
源图客1 小时前
Aitoearn:OPC(一人公司)的AI内容智能体
人工智能·dreamweaver