【深度学习】学习笔记——局部极小值和鞍点(Datawhale X 李宏毅苹果树AI夏令营)

做深度学习的时候,损失不是只在局部极小值的梯度是0,还有可能是其他情况,比如鞍点,鞍点就是梯度为0且区别于局部极小值和局部极大值的点。

如果损失收敛在局部极小值,所在位置已经是损失最低的点了,但是鞍点旁边还是有路可以让损失更低,只要逃离鞍点,有可能让损失更低。

当损失函数复杂时,无法知道完整损失函数的样子,但是可以通过给定一组参数如 θ ′ \theta ' θ′,其附近的损失函数用泰勒级数近似写出来。
L ( θ ) ≈ L ( θ ′ ) + ( θ − θ ′ ) T g + 1 2 ( θ − θ ′ ) T H ( θ − θ ′ ) L(\theta) \approx L({\theta}')+(\theta-{\theta}')^Tg+\frac{1}{2}(\theta-{\theta}')^TH(\theta-{\theta}') L(θ)≈L(θ′)+(θ−θ′)Tg+21(θ−θ′)TH(θ−θ′)

算出一个海森矩阵后,不需要把它跟所有的 ( θ − θ ′ ) (\theta-{\theta}') (θ−θ′)都乘乘看,只要看海森矩阵 H H H的特征值。若 H H H的所有特征值都是正的, H H H为正定矩阵,则 ( θ − θ ′ ) T H ( θ − θ ′ ) > 0 (\theta-{\theta}')^TH(\theta-{\theta}')>0 (θ−θ′)TH(θ−θ′)>0,临界点是局部极小值。若 H H H的所有特征值都是负的, H H H为负定矩阵,则 ( θ − θ ′ ) T H ( θ − θ ′ ) < 0 (\theta-{\theta}')^TH(\theta-{\theta}')<0 (θ−θ′)TH(θ−θ′)<0,临界点是局部极大值。若 H H H的特征值有正有负,临界点是鞍点。

相关推荐
Wis4e3 分钟前
基于PyTorch的深度学习——迁移学习1
pytorch·深度学习·机器学习
deng-c-f6 分钟前
Linux C/C++ 学习日记(55):原子操作(四):实现无锁队列
学习
黄昏单车9 分钟前
golang语言基础到进阶学习笔记
笔记·golang·go
北山小恐龙11 分钟前
针对性模型压缩:YOLOv8n安全帽检测模型剪枝方案
人工智能·深度学习·算法·计算机视觉·剪枝
小韩博14 分钟前
小迪安全 · 第 39 课学习笔记
笔记·学习·安全·网络安全
Wis4e14 分钟前
基于PyTorch的深度学习——迁移学习2
pytorch·深度学习·迁移学习
非凡ghost15 分钟前
Topaz Video(人工智能视频增强软件)
人工智能·windows·学习·音视频·软件需求
西西学代码18 分钟前
《Flutter实战笔记》
笔记
从负无穷开始的三次元代码生活18 分钟前
深度学习知识点概念速通——人工智能专业考试基础知识点
人工智能·深度学习
重生之我在番茄自学网安拯救世界18 分钟前
网络安全中级阶段学习笔记(十):upload靶场实战(17关以及问题解决)
笔记·学习·网络安全·文件上传漏洞·图片木马