一文快速理解线性回归的过程

做线性回归的过程如图1所示。图中的实线框表示必不可少的步骤,虚线框表示可选的步骤。

首先要准备数据。通常准备数据先是要加载数据。数据的来源可以是文本文件、Excel文件、各种数据库。

要想打好机器学习的数学基础,请参见清华大学出版社的人人可懂系列,包括《人人可懂的微积分》(已上市)、《人人可懂的线性代数》(即将上市)、《人人可懂的概率统计》(即将上市)。

图1 做线性回归的过程

加载完数据后,通常会要对数据进行清洗。可以在加载之前就清洗好数据,也可以在加载之后用Python程序清洗。常见的清洗工作包括去掉有缺失项的数据或对有缺失的数据用一定的算法做填充、将文本置换成数字表示、将数据置换成特定的特征值等。

还要按模型建模的需要来准备数据。后续我们还会讲解这样的实例。

准备好数据后,就要拟合方程了。线性回归的做法是假定已知数据的关系会呈线性,给定一个特定的线性方程,再求解这个线性方程的系数、截距。

**提示:**提醒大家要特别注意的是:机器学习模型求解的不是x ,而是模型中的参数,线性回归里这些参数就是 θ 0 ... θ n \theta_{0}\ldots\theta_{n} θ0...θn。这一点一定要理解,由于数学中常用x 表示未知量,初学者很容易混淆。这里要把x 看成已知的量来求解未知参数 θ 0 ... θ n \theta_{0}\ldots\theta_{n} θ0...θn。

求解模型后可以将模型保存起来备用、也可以输出模型的效果图。最为直观的方法自然是作图。只是三维及三维以下的图形还可以图示,三维以上的图形就不能图示了。不过,还可以对数据作降维处理后降到三维就可以图示了。

要想打好机器学习的数学基础,请参见清华大学出版社的人人可懂系列,包括《人人可懂的微积分》(已上市)、《人人可懂的线性代数》(即将上市)、《人人可懂的概率统计》(即将上市)。

使用模型主要就是用模型来做预测,即根据新输入的特征数据项使用模型来预测目标数据项的值。如果有多个模型则可作模型的比较来从中选取最佳的模型来做预测。根据什么评价指标来比较呢?有很多种评价指标可以选用。

相关推荐
人工智能培训2 小时前
大模型与传统小模型、传统NLP模型的核心差异解析
人工智能·深度学习·神经网络·机器学习·生成对抗网络
x_yeyue2 小时前
三角形数
笔记·算法·数论·组合数学
念何架构之路3 小时前
Go语言加密算法
数据结构·算法·哈希算法
AI科技星3 小时前
《数学公理体系·第三部·数术几何》(2026 年版)
c语言·开发语言·线性代数·算法·矩阵·量子计算·agi
失去的青春---夕阳下的奔跑3 小时前
560. 和为 K 的子数组
数据结构·算法·leetcode
砥锋4 小时前
纯NumPy手写两层GCN:从零开始理解图神经网络核心思想
机器学习
Larcher4 小时前
🔥 告别抓瞎:用 Claude Code (cc) 优雅接手与维护已有项目
javascript·机器学习·前端框架
黎阳之光4 小时前
黎阳之光:以视频孪生重构智慧医院信息化,打造高标项目核心竞争力
大数据·人工智能·物联网·算法·数字孪生
丷丩4 小时前
三级缓存下MVT地图瓦片服务性能优化策略
算法·缓存·性能优化·gis·geoai-up