数学建模常用模型(九) :偏最小二乘回归分析

数学建模常用模型(九) :偏最小二乘回归分析

偏最小二乘回归(Partial Least Squares Regression,PLS Regression)是一种常用的统计建模方法,用于解决多元线性回归中自变量间高度相关的问题。在偏最小二乘回归中,通过将原始自变量转换为一组新的综合变量(称为主成分或潜在变量),然后再使用这些主成分进行回归分析,从而减少自变量之间的共线性,并且提高模型的稳定性和预测能力。
这是我自己总结的一些代码和资料(本文中的代码以及参考书籍等),放在github上供大家参考: https://github.com/HuaandQi/Mathematical-modeling.git

1.补充介绍

偏小二乘回归提供一种多对多线性回归建模的方法,特别当两组变量的个数很多,且都存在多重相关性,而观测数据的数量(样本量)又较少时,用偏小二乘回归建立的模型具有传统的经典回归分析等方法所没有的优点。

偏小二乘回归分析在建模过程中集中了主成分分析,典型相关分析和线性回归分析方法的特点,因此在分析结果中,除了可以提供一个更为合理的回归模型外,还可以同时完成一些类似于主成分分析和典型相关分析的研究内容,提供更丰富、深入的一些信息。

2.程序实例

cpp 复制代码
import numpy as np
from sklearn.cross_decomposition import PLSRegression
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt

# 原始数据,自变量X和因变量y
X = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]])
y = np.array([1, 2, 3, 4])

# 对自变量进行标准化处理
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# 创建PLSRegression对象,并指定主成分个数为2
pls = PLSRegression(n_components=2)

# 进行偏最小二乘回归分析
pls.fit(X_scaled, y)

# 获得预测值
y_pred = pls.predict(X_scaled)

# 绘制原始数据和预测值
plt.figure(figsize=(8, 6))
plt.scatter(y, y_pred, c='b', label='Predicted vs. Observed')
plt.plot([min(y), max(y)], [min(y), max(y)], 'k--', lw=2, label='Perfect Fit')
plt.xlabel('Observed')
plt.ylabel('Predicted')
plt.title('PLS Regression')
plt.legend()
plt.grid(True)
plt.show()

在上述代码中,我们首先定义了原始数据矩阵X和因变量向量y,然后创建了一个PLSRegression对象并指定保留的主成分个数为2。接下来,使用fit()方法进行偏最小二乘回归分析,并使用coef_属性获取回归系数。最后,使用predict()方法对原始数据进行预测,并获得预测值y_pred。请根据实际情况调整原始数据和保留的主成分个数,并根据需要对结果进行解释和分析。

运行上述代码,将绘制散点图来展示观察值(原始数据)与预测值之间的关系。如果模型拟合良好,散点图中的点应该基本落在对角线上。如果点主要集中在对角线上方,则预测值高估了观察值;如果点主要集中在对角线下方,则预测值低估了观察值。在理想情况下,所有点都应该在对角线上。

3.运行结果

相关推荐
数模加油站13 小时前
2025数学建模美赛|E题成品论文
数学建模·数学建模美赛·2025美赛·美赛论文
抱抱宝13 小时前
Pyecharts之图表组合与布局优化
信息可视化·数据挖掘·数据分析
九亿AI算法优化工作室&18 小时前
DBO优化GRNN回归预测matlab
人工智能·python·算法·matlab·数据挖掘·回归·机器人
数模加油站19 小时前
2025数学建模美赛|赛题翻译|E题
数学建模·翻译·数学建模美赛·2025美赛
抱抱宝19 小时前
Pyecharts之饼图与多饼图的应用
信息可视化·数据挖掘·数据分析
金融OG19 小时前
6. 马科维茨资产组合模型+政策意图AI金融智能体(DeepSeek-V3)增强方案(理论+Python实战)
大数据·人工智能·python·算法·机器学习·数学建模·金融
可编程芯片开发20 小时前
基于回归分析法的光伏发电系统最大功率计算simulink建模与仿真
数据挖掘·回归·simulink·回归分析法·光伏发电系统·最大功率计算
小天数模1 天前
【2025美赛D题】为更美好的城市绘制路线图建模|建模过程+完整代码论文全解全析
数学建模
程序员阿龙1 天前
【精选】基于数据挖掘的招聘信息分析与市场需求预测系统 职位分析、求职者趋势分析 职位匹配、人才趋势、市场需求分析数据挖掘技术 职位需求分析、人才市场趋势预测
人工智能·数据挖掘·数据分析与可视化·数据挖掘技术·人才市场预测·招聘信息分析·在线招聘平台
Better Rose1 天前
【2025年数学建模美赛E题】(农业生态系统)完整解析+模型代码+论文
数学建模·e题·美赛·美赛e题·2025美赛e题