自定义数据集使用scikit-learn中的包实现线性回归方法对其进行拟合

辞落山2025-01-27 8:58

1. 引言

简要介绍线性回归模型及其在机器学习中的应用。

2. 创建自定义数据集

通过生成一个简单的自定义数据集来模拟问题。可以使用numpy生成数据。

复制代码

import numpy as np
import matplotlib.pyplot as plt

# 生成自定义数据
np.random.seed(42)
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)

3. 使用scikit-learn实现线性回归

使用LinearRegression类拟合数据并进行预测。

复制代码

from sklearn.linear_model import LinearRegression

# 初始化线性回归模型
lin_reg = LinearRegression()

# 拟合模型
lin_reg.fit(X, y)

# 预测
y_pred = lin_reg.predict(X)

# 输出模型参数
print(f"模型的截距：{lin_reg.intercept_}")
print(f"模型的系数：{lin_reg.coef_}")

4. 可视化拟合结果

绘制原始数据与回归线。

复制代码

plt.scatter(X, y, color='blue', label='数据点')
plt.plot(X, y_pred, color='red', label='拟合线')
plt.xlabel('X')
plt.ylabel('y')
plt.legend()
plt.show()

5. 结论

使用scikit-learn进行线性回归拟合的步骤，并强调模型参数的含义。