梯度下降的基本原理

序言:最近再整理之前的一些笔记,感觉梯度下降之前整理的很详细也很杂乱,删了也不是,留着看着也烦,就发到这里来当个备用吧。

随机梯度下降(SGD)

求极小值:①有条件的极小值(有条件的用拉格朗日),②无条件的极小值(无条件的用梯度下降)。

梯度是什么:

梯度有什么用:

怎么走:

梯度下降的迭代举例:

关键算法:

Momentum算法

NAG算法

Adagrad算法

RMSprop算法

解决了Adagrad算法中学习率衰减过快的问题。

改进点:1.时间窗口机制

2.均值代替平方和

3.历史梯度均值和当前梯度加权平均

AdaDelta算法

Adam算法

Adam吸收了Adagrad(自适应学习率的梯度下降算法)和动量梯度下降算法的优点既能适应稀疏梯度(即自然语言和计算机视觉问题),又能缓解梯度震荡的问题.

相关推荐
目黑live +wacyltd6 分钟前
算法备案:常见驳回原因与应对策略
人工智能·算法
新知图书11 分钟前
销售资料包智能生成(使用千问)
人工智能·ai助手·千问·高效办公
Cosolar25 分钟前
大模型应用开发面试 • 第4期|A2A、复杂挑战与具身智能
人工智能·后端·面试
2501_9458374327 分钟前
OpenClaw:重塑人机协作的开源 AI 智能体
人工智能
磊 子30 分钟前
多态类原理+四种类型转换+异常处理
开发语言·c++·算法
小何code30 分钟前
人工智能【第27篇】AI伦理与安全:负责任的AI开发
人工智能·隐私保护·ai伦理·算法公平
咚咚王者33 分钟前
人工智能之智能体应用 第一章 大模型应用开发基础框架入门
人工智能
边缘计算社区37 分钟前
6G “AI-Native”:真命题还是PPT?拆解3GPP R19/R20的AI条款
人工智能·ai-native
吴佳浩1 小时前
OpenClaw最严厉的父亲- 使用优化建议
人工智能·llm·agent
安吉升科技1 小时前
ai双目智能客流摄像头是什么?有哪些作用呢?
人工智能