【跟马少平老师学AI】-【神经网络是怎么实现的】(五)梯度消失问题

一句话归纳:
1)用sigmoid激活函数时,BP算法更新公式为:

用sigmoid函数,O取值为0~1,O(1-O)最大值为0.25,若神经网络层数多,则会造成更新项趋近于0,称为梯度消失。

2)GooLeNet解决梯度消失的问题:

  • 在不同的深度构造了3个输出。
  • inception模块:
  • 其中,1*1卷积起到改变维度的作用,减少参数个数,比如,输入为192个通道,经过32个1*1卷积核运算,即可以将通道数降为32。

3)神经网络并不完全随着深度的增加提高正确率。

4)残差网络(ResNet):

残差块:

  • 通过恒等映射,梯度无衰减传递,消除梯度消失。
  • 解决网络退化问题。
  • 虚线恒等映射,在恒等映射的基础上,加个卷积层,以和F(X)同等大小、同样通道数的映射。
  • 全局平均池化层,经过池化,每个通道变成一个平均数。
相关推荐
酒酿小圆子~30 分钟前
【NLP】语言模型的发展历程 (1)
人工智能·语言模型·自然语言处理
liruiqiang053 小时前
关于ReLU激活函数的解释以及其在神经网络中的应用
人工智能
冻感糕人~4 小时前
使用LangChain、CrewAI、AutoGen搭建数据分析Agent
人工智能·windows·ai·数据分析·langchain·大模型·agent
今天吃饺子5 小时前
小创新模型!6种2024算法优化BiTCN-SVM单变量输入单步预测,MATLAB机器学习预测全家桶再更新...
人工智能·算法·机器学习·支持向量机·matlab
知来者逆7 小时前
基于ADAS 与关键点特征金字塔网络融合的3D LiDAR目标检测原理与算法实现
人工智能·目标检测·计算机视觉·3d·自动驾驶·lidar·3d 点云
Odaily_7 小时前
SVM赛道概览:MoveVM落地,SVM能走多远
人工智能·算法·机器学习·支持向量机·数据挖掘
liruiqiang057 小时前
如何理解机器学习中的非线性模型 ?
人工智能·机器学习
—Qeyser7 小时前
[石榴翻译] 维吾尔语音识别 + TTS语音合成
人工智能·php·语音识别·laravel
美格智能8 小时前
CES 2025|全面拥抱端侧AI,美格智能在CES发布系列创新成果
人工智能
golitter.8 小时前
机器学习:逻辑回归
人工智能·机器学习·逻辑回归