【mechine learning-九-梯度下降】

梯度下降

上一节讲过,随机的寻找w和b使损失最小不是一种合适的方法,梯度下降算法就是解决解决这个问题的,它不仅可以用于线性回归,还可以用于神经网络等深度学习算法,是目前的通用性算法。

更加通用的梯度下降算法

之前二维关于w和b的损失函数(无特殊说明,均以均方误差成本函数为例)如下:,

但是在更多的例子里,或者说更加复杂的神经网络里面,w是很多个,目前很多模型都是超过几千亿参数:

已经无法使用随机法来解决最小化J这个损失,必须用更加通用的梯度下降算法来解决最小化损失的问题。

算法步骤

假设某一个模型的成本函数也就是Loss fuction如上(不是线性回归也不是均方误差):

如何从这里面找到J的最小值呢?方法如下:

  1. 设定w和b初始值。如图中左边这条线的起点。
  2. 从现在的位置旋转360度,找到J下降最快的点,向下走一步。(这意味着你走的是最快下山的路)
  3. 以下降后的位置,重复上述步骤,直到发现走到了一个局部最小的山谷底,也就是J的具备最小值。

梯度下降有意思的一件事情,假设随机选择的起始点是另外一个位置,比如右面这条线的起始点,那么找到的就是右边这个局部的最低点,这两个是完全不同的最低点。至于具体怎么实现算法留在下一节。

相关推荐
oil欧哟2 分钟前
产品图质感提升指南:光影、材质、构图的底层逻辑与 AI 优化方案
人工智能·ai作画·材质·opencreator
ARM+FPGA+AI工业主板定制专家2 分钟前
基于JETSON/RK3588+FPGA+AI商用自动割草机器人方案
人工智能·目标检测·计算机视觉·fpga开发·机器人
谷粒.7 分钟前
AI在测试中的应用:从自动化到智能化的跨越
运维·前端·网络·人工智能·测试工具·开源·自动化
秋刀鱼 ..17 分钟前
2025年第二届智能制造与自动化国际研讨会(ISIMA 2025)
运维·人工智能·python·自动化·能源·制造
℉AVE18 分钟前
基于计算机视觉的病虫害检测技术
人工智能·计算机视觉
ARM+FPGA+AI工业主板定制专家19 分钟前
基于JETSON ORIN+FPGA+GMSL+AI的高带宽低延迟机器视觉方案
网络·人工智能·目标检测·计算机视觉·fpga开发·自动驾驶
raoxiaoya34 分钟前
用golang开发AI Agent项目,有哪些框架可以选择
开发语言·人工智能·golang
工藤学编程34 分钟前
AI Ping 赋能:基于 Kimi-K2-Thinking + LangChain 打造网盘在线文档总结助手
人工智能·langchain·ai ping
HillVue35 分钟前
夸克对话助手,填补了中国版 ChatGPT 的缺口
人工智能·chatgpt·宽度优先·推荐算法
卡奥斯开源社区官方36 分钟前
AI智能眼镜技术解构与开发指南:从硬件方案到XR生态落地
人工智能·xr