最小二乘法-超详细推导(转换为矩阵乘法推导,矩阵求导推导)

最小二乘法就是让均方误差最小。

下面是损失函数转换为矩阵方式的详解

如何让其最小,在导数为0的地方取极小值

问:导数为0的地方可能去极大值,也可能是极小值,凭什么说导数为0就是极小值?

答:因为使用的是均方误差,他是一个凹函数,导数为0的点即为最小值和极小值。

建议学习一下线性代数

先看这个例子,怕有的人看不懂之后咋来的。

以此类推:

上述式子中共有4项,最后一项不含θ ,所以求导为0,其余前三项求导,下面将给出矩阵的求导方式。

因为x是我们的数据,θ 才是我们要的参数,所以对θ 求θ 导。

由此别得到最优解。

相关推荐
workflower21 小时前
用硬件换时间”与“用算法降成本”之间的博弈
人工智能·算法·安全·集成测试·无人机·ai编程
zxhl09271 天前
大模型微调技术 LoRA、QLoRA、QA-LoRA 原理
人工智能·深度学习·机器学习
重生之我是Java开发战士1 天前
【动态规划】简单多状态dp问题:按摩师,打家劫舍,删除并获得点数,粉刷房子,买卖股票的最佳时机
算法·动态规划·哈希算法
2301_764441331 天前
OpenClaw框架的多Agent协作系统
人工智能·机器学习·语言模型·自然语言处理·ai编程
老刘说AI1 天前
浅谈多模态领域的Transformer
人工智能·深度学习·神经网络·机器学习·语言模型·transformer
KAU的云实验台1 天前
单/多UAV、静/动态路径规划,基于PlatEMO平台的带约束多目标优化 本文核心内容:
算法·matlab·无人机
Liangwei Lin1 天前
洛谷 P1807 最长路
数据结构·算法
会编程的土豆1 天前
【数据结构与算法】二叉树从建立开始
数据结构·c++·算法
_日拱一卒1 天前
LeetCode:最大子数组和
数据结构·算法·leetcode