【数学】什么是最小二乘法?如何求解最小二乘法?

背景

最小二乘法(Least Squares Method)是一种用于找到数据点最佳拟合曲线的数学优化技术。它通过最小化数据点和拟合曲线之间的误差平方和来实现。广泛应用于统计学、数据分析和机器学习中。

公式

最小二乘法的基本公式如下:

  1. 线性回归模型:
    y ^ = β 0 + β 1 x \hat{y} = \beta_0 + \beta_1 x y^=β0+β1x
  2. 误差平方和(SSE):
    S S E = ∑ i = 1 n ( y i − y ^ i ) 2 = ∑ i = 1 n ( y i − ( β 0 + β 1 x i ) ) 2 SSE = \sum_{i=1}^{n} (y_i - \hat{y}i)^2 = \sum{i=1}^{n} (y_i - (\beta_0 + \beta_1 x_i))^2 SSE=i=1∑n(yi−y^i)2=i=1∑n(yi−(β0+β1xi))2
  3. 通过求解最小化误差平方和,得出最佳拟合参数:
    β 1 = n ∑ ( x i y i ) − ∑ x i ∑ y i n ∑ x i 2 − ( ∑ x i ) 2 \beta_1 = \frac{n \sum (x_i y_i) - \sum x_i \sum y_i}{n \sum x_i^2 - (\sum x_i)^2} β1=n∑xi2−(∑xi)2n∑(xiyi)−∑xi∑yi
    β 0 = ∑ y i − β 1 ∑ x i n \beta_0 = \frac{\sum y_i - \beta_1 \sum x_i}{n} β0=n∑yi−β1∑xi

示例题目

假设我们有以下数据点: ( 1 , 2 ) (1, 2) (1,2)、 ( 2 , 3 ) (2, 3) (2,3)、 ( 3 , 5 ) (3, 5) (3,5)、 ( 4 , 4 ) (4, 4) (4,4)、 ( 5 , 6 ) (5, 6) (5,6)。求最佳拟合直线。

详细讲解

  1. 计算必要的求和:
    ∑ x i = 1 + 2 + 3 + 4 + 5 = 15 \sum x_i = 1 + 2 + 3 + 4 + 5 = 15 ∑xi=1+2+3+4+5=15
    ∑ y i = 2 + 3 + 5 + 4 + 6 = 20 \sum y_i = 2 + 3 + 5 + 4 + 6 = 20 ∑yi=2+3+5+4+6=20
    ∑ x i 2 = 1 2 + 2 2 + 3 2 + 4 2 + 5 2 = 55 \sum x_i^2 = 1^2 + 2^2 + 3^2 + 4^2 + 5^2 = 55 ∑xi2=12+22+32+42+52=55
    ∑ x i y i = 1 ⋅ 2 + 2 ⋅ 3 + 3 ⋅ 5 + 4 ⋅ 4 + 5 ⋅ 6 = 70 \sum x_i y_i = 1 \cdot 2 + 2 \cdot 3 + 3 \cdot 5 + 4 \cdot 4 + 5 \cdot 6 = 70 ∑xiyi=1⋅2+2⋅3+3⋅5+4⋅4+5⋅6=70

  2. 计算斜率 β 1 \beta_1 β1:
    β 1 = 5 ⋅ 70 − 15 ⋅ 20 5 ⋅ 55 − 1 5 2 = 350 − 300 275 − 225 = 50 50 = 1 \beta_1 = \frac{5 \cdot 70 - 15 \cdot 20}{5 \cdot 55 - 15^2} = \frac{350 - 300}{275 - 225} = \frac{50}{50} = 1 β1=5⋅55−1525⋅70−15⋅20=275−225350−300=5050=1

  3. 计算截距 β 0 \beta_0 β0:
    β 0 = 20 − 1 ⋅ 15 5 = 5 5 = 1 \beta_0 = \frac{20 - 1 \cdot 15}{5} = \frac{5}{5} = 1 β0=520−1⋅15=55=1

  4. 最佳拟合直线方程为:
    y ^ = 1 + 1 x = x + 1 \hat{y} = 1 + 1x = x + 1 y^=1+1x=x+1

Python代码求解

python 复制代码
import numpy as np
import matplotlib.pyplot as plt

# 数据点
x = np.array([1, 2, 3, 4, 5])
y = np.array([2, 3, 5, 4, 6])

# 最小二乘法计算
A = np.vstack([x, np.ones(len(x))]).T
beta, beta_0 = np.linalg.lstsq(A, y, rcond=None)[0]

# 绘图
plt.plot(x, y, 'o', label='原始数据', markersize=10)
plt.plot(x, beta * x + beta_0, 'r', label='拟合直线')
plt.legend()
plt.show()

实际生活中的例子

在经济学中,最小二乘法可以用来预测消费支出与收入之间的关系。例如,根据历史数据,使用最小二乘法可以拟合出消费支出与收入的关系直线,从而预测未来的消费行为。

相关推荐
冲帕Chompa10 分钟前
图论part09dijkstra算法
算法·图论
·云扬·18 分钟前
【PmHub后端篇】PmHub中基于Redis加Lua脚本的计数器算法限流实现
redis·算法·lua
周Echo周21 分钟前
20、map和set、unordered_map、un_ordered_set的复现
c语言·开发语言·数据结构·c++·算法·leetcode·list
zkmall24 分钟前
推荐算法工程化:ZKmall模板商城的B2C 商城的用户分层推荐策略
算法·机器学习·推荐算法
龙湾开发28 分钟前
轻量级高性能推理引擎MNN 学习笔记 02.MNN主要API
人工智能·笔记·学习·机器学习·mnn
矿渣渣1 小时前
AFFS2 的 `yaffs_ext_tags` 数据结构详解
数据结构·算法·文件系统·yaffs2
CopyLower1 小时前
Java与AI技术结合:从机器学习到生成式AI的实践
java·人工智能·机器学习
Tech Synapse1 小时前
联邦学习图像分类实战:基于FATE与PyTorch的隐私保护机器学习系统构建指南
pytorch·机器学习·分类
workflower1 小时前
使用谱聚类将相似度矩阵分为2类
人工智能·深度学习·算法·机器学习·设计模式·软件工程·软件需求
cwywsx1 小时前
Linux:进程控制2
linux·运维·算法