十大机器学习算法-学习笔记-章节1-线性回归—

一、前言

什么是线性回归？

线性回归是一种用于建立变量之间关系的统计方法。具体来说，它通过拟合一条直线（在多变量情况下则是超平面）来预测因变量（响应变量）与一个或多个自变量（预测变量）之间的关系。线性回归的主要目标是找到最适合数据的直线，使得预测值与实际值之间的误差最小化。

线性回归的主要组成部分包括：

回归方程： 线性回归模型通常可以表示为：

y=β0+β1x1+β2x2+⋯+βnxn+ϵy=β0+β1x1+β2x2+⋯+βnxn+ϵ

其中，yy 是因变量，x1,x2,...,xnx1,x2,...,xn 是自变量，β0β0 是截距，β1,β2,...,βnβ1,β2,...,βn 是回归系数，ϵϵ 是误差项。
最小二乘法： 线性回归通常通过最小二乘法来估计回归系数。最小二乘法的目标是最小化预测值和实际值之间的平方差之和。
拟合优度： 线性回归模型的拟合优度可以通过 R2R2（决定系数）来衡量，它表示模型解释了因变量总变异的百分比。
假设检验： 回归系数的显著性通常通过t检验来检验，以确定每个自变量是否对因变量有显著影响。
模型假设： 线性回归模型通常有一些假设，包括线性关系、误差项的正态分布、同方差性（即误差项的方差恒定）以及自变量之间没有多重共线性等。