1. 引言
简要介绍线性回归模型及其在机器学习中的应用。
2. 创建自定义数据集
通过生成一个简单的自定义数据集来模拟问题。可以使用numpy
生成数据。
import numpy as np
import matplotlib.pyplot as plt
# 生成自定义数据
np.random.seed(42)
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)
3. 使用scikit-learn实现线性回归
使用LinearRegression
类拟合数据并进行预测。
from sklearn.linear_model import LinearRegression
# 初始化线性回归模型
lin_reg = LinearRegression()
# 拟合模型
lin_reg.fit(X, y)
# 预测
y_pred = lin_reg.predict(X)
# 输出模型参数
print(f"模型的截距:{lin_reg.intercept_}")
print(f"模型的系数:{lin_reg.coef_}")
4. 可视化拟合结果
绘制原始数据与回归线。
plt.scatter(X, y, color='blue', label='数据点')
plt.plot(X, y_pred, color='red', label='拟合线')
plt.xlabel('X')
plt.ylabel('y')
plt.legend()
plt.show()
5. 结论
使用scikit-learn进行线性回归拟合的步骤,并强调模型参数的含义。