机器学习——正规方程

正规方程的基本介绍

之前我们使用梯度下降算法求代价函数J(θ)的最小值,而梯度下降算法是通过一步步不断地迭代来收敛到全局最小值,如下

而正规方程则是另一种求解J(θ)最小值的方法,并且正规方程不需要通过迭代,而是一次性得到θ的最优值

正规方程的基本概念如下(省略证明过程,记住这个公式就行)

正规方程和梯度下降的对比

  • 梯度下降算法需要不断尝试不同的学习率α,直到选择到一个合适的值,这是一个额外的工作;而正规方程不需要选择学习率;
  • 梯度下降算法是一个迭代算法,需要通过不断地迭代得到θ的最优值;正规方程不需要迭代,基本是一次性可以得到θ的最优值;
  • 梯度下降算法在特征变量很多的情况下,也能运行的很好,哪怕有几百万个特征向量,但是正规方程需要进行矩阵的运算,所以当特征变量很多的时候,正规方程的计算速度不一定比梯度下降的迭代要快;
  • 那么特征数量n多少算大呢?一般如果n超过一万,就考察使用梯度下降或其他算法,如果n在一万以内,可以使用正规方程;
  • 对于线性回归这个特定的模型,正规方程法是一个比梯度下降算法更快的替代算法,但是正规方程不一定适用于其他的学习算法,而梯度下降算法的使用范围比正规方程更广泛。所以还是要根据具体的算法,具体的问题以及特征量的数量来进行最终选择;
相关推荐
IT古董10 分钟前
【漫话机器学习系列】261.工具变量(Instrumental Variables)
人工智能·机器学习
小王格子14 分钟前
AI 编程革命:腾讯云 CodeBuddy 如何重塑开发效率?
人工智能·云计算·腾讯云·codebuddy·craft
好吃的肘子24 分钟前
Elasticsearch架构原理
开发语言·算法·elasticsearch·架构·jenkins
MonkeyKing_sunyuhua25 分钟前
VSCode + Cline AI辅助编程完全指南
ide·人工智能·vscode
Leinwin32 分钟前
Microsoft Azure 服务4月更新告示
人工智能·azure
胡耀超35 分钟前
霍夫圆变换全面解析(OpenCV)
人工智能·python·opencv·算法·计算机视觉·数据挖掘·数据安全
软行40 分钟前
LeetCode 每日一题 3341. 到达最后一个房间的最少时间 I + II
数据结构·c++·算法·leetcode·职场和发展
jndingxin43 分钟前
OpenCV CUDA 模块中用于在 GPU 上计算两个数组对应元素差值的绝对值函数absdiff(
人工智能·opencv·计算机视觉
jerry60943 分钟前
LLM笔记(五)概率论
人工智能·笔记·学习·概率论