线性回归求解

总成绩 XXX 和数学成绩 YYY 数据如下:

1 求数学成绩对总成绩的回归方程。

2 如果一个学生总成绩是450,求该学生的数学成绩。

这个基本上算是目前机器学习的基石了,说起来也算是高中的知识范围,我不知道是不是人人都懂了,我觉得我不是很懂,所以专门写一篇来总结总结。。。

回归方程是Y=a+bX。所以现在要求的就是截距a和回归系数b。

首先计算平均值:

然后计算回归系数b

计算截距a

所以方程是:

Y=14.49+0.1325X

那么第二个问题也很好解了。代入总成绩 X=450X = 450X=450,Y = 14.49+0.1325×450=14.49+59.625=74.115。

上面的过程基本不算难,就是回归系数的推算,看了下是最小二乘法。

然后推断出上面的回归系数公式。

对了,再提一嘴,两个点求函数怎么求呢?这个初中知识。。。

斜率b = (y2 - y1)/(x2 - x1)

截距a = y - ax(任意一个点都行)

在现代计算机中,这部分都是改成矩阵运算了(所以最早搞游戏矩阵运算的老黄接下了这个泼天富贵。。。)

其中,XXX 是自变量矩阵,YYY 是因变量向量。

这里面具体的算法容我后面再看看。。。

再说说最小二乘法,其实这个翻译真的很有问题,弯弯那边翻译成最小平方法,我觉得很贴切。一张图就可以看到这个的本质

本质就是使得绿线的平方和最小,那么这个曲线就是最优。为什么用平方不用绝对值呢?据说原因有二。1是平方计算可导,更加方便。2是用平方可以放大误差,这样计算效果更好。

所以最小二乘法通过最小化以下目标函数来找到最佳拟合直线,基本就是算=0的情况。

最后再早说说最小二乘法和梯度下降算法。

最小二乘法和梯度下降算法在目标和应用上有所区别,理解它们的关系和差异,有助于选择合适的方法解决具体问题。最小二乘法适用于简单线性回归和小数据集,而梯度下降则更灵活,适用于复杂和大规模数据集。

简而言之,就是最小二乘法只能用在简单的场景。复杂的还是只能用梯度下降。。。

参考:

最小二乘法

相关推荐
酷飞飞5 小时前
Python网络与多任务编程:TCP/UDP实战指南
网络·python·tcp/ip
风中的微尘6 小时前
39.网络流入门
开发语言·网络·c++·算法
数字化顾问6 小时前
Python:OpenCV 教程——从传统视觉到深度学习:YOLOv8 与 OpenCV DNN 模块协同实现工业缺陷检测
python
西红柿维生素7 小时前
JVM相关总结
java·jvm·算法
学生信的大叔7 小时前
【Python自动化】Ubuntu24.04配置Selenium并测试
python·selenium·自动化
诗句藏于尽头8 小时前
Django模型与数据库表映射的两种方式
数据库·python·django
智数研析社8 小时前
9120 部 TMDb 高分电影数据集 | 7 列全维度指标 (评分 / 热度 / 剧情)+API 权威源 | 电影趋势分析 / 推荐系统 / NLP 建模用
大数据·人工智能·python·深度学习·数据分析·数据集·数据清洗
扯淡的闲人8 小时前
多语言编码Agent解决方案(5)-IntelliJ插件实现
开发语言·python
moxiaoran57538 小时前
Flask学习笔记(一)
后端·python·flask
ChillJavaGuy8 小时前
常见限流算法详解与对比
java·算法·限流算法