![](https://file.jishuzhan.net/article/1794651878395482114/936508998430cb651a9ef7e01d97abcf.webp)
最小二乘法就是让均方误差最小。
下面是损失函数转换为矩阵方式的详解
![](https://file.jishuzhan.net/article/1794651878395482114/90a7ed359c94c1ccef48dff0b97893fd.webp)
如何让其最小,在导数为0的地方取极小值。
问:导数为0的地方可能去极大值,也可能是极小值,凭什么说导数为0就是极小值?
答:因为使用的是均方误差,他是一个凹函数,导数为0的点即为最小值和极小值。
建议学习一下线性代数
先看这个例子,怕有的人看不懂之后咋来的。
![](https://file.jishuzhan.net/article/1794651878395482114/344f3842d9c97019725fddae672e85d1.webp)
以此类推:
![](https://file.jishuzhan.net/article/1794651878395482114/fb9aa54876b05ccd3dde87d03bad1251.webp)
上述式子中共有4项,最后一项不含θ ,所以求导为0,其余前三项求导,下面将给出矩阵的求导方式。
因为x是我们的数据,θ 才是我们要的参数,所以对θ 求θ 导。
![](https://file.jishuzhan.net/article/1794651878395482114/99c7a9cc054cac1cab5f5f3a1d203789.webp)