自定义数据集使用scikit-learn中的包实现线性回归方法对其进行拟合

1. 引言

简要介绍线性回归模型及其在机器学习中的应用。

2. 创建自定义数据集

通过生成一个简单的自定义数据集来模拟问题。可以使用numpy生成数据。

复制代码
import numpy as np
import matplotlib.pyplot as plt

# 生成自定义数据
np.random.seed(42)
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)

3. 使用scikit-learn实现线性回归

使用LinearRegression类拟合数据并进行预测。

复制代码
from sklearn.linear_model import LinearRegression

# 初始化线性回归模型
lin_reg = LinearRegression()

# 拟合模型
lin_reg.fit(X, y)

# 预测
y_pred = lin_reg.predict(X)

# 输出模型参数
print(f"模型的截距:{lin_reg.intercept_}")
print(f"模型的系数:{lin_reg.coef_}")

4. 可视化拟合结果

绘制原始数据与回归线。

复制代码
plt.scatter(X, y, color='blue', label='数据点')
plt.plot(X, y_pred, color='red', label='拟合线')
plt.xlabel('X')
plt.ylabel('y')
plt.legend()
plt.show()

5. 结论

使用scikit-learn进行线性回归拟合的步骤,并强调模型参数的含义。

相关推荐
避避风港11 分钟前
Java 抽象类
java·开发语言·python
武子康1 小时前
Java-168 Neo4j CQL 实战:WHERE、DELETE/DETACH、SET、排序与分页
java·开发语言·数据库·python·sql·nosql·neo4j
天地之于壹炁兮1 小时前
元素认证的智慧:Python分支魔法的艺术与禁忌
windows·python
闲人编程1 小时前
Python与大数据:使用PySpark处理海量数据
大数据·开发语言·分布式·python·spark·codecapsule·大规模
daqinzl2 小时前
Ubuntu 使用 Python 启动 HTTP 服务
python·ubuntu·http server 服务
qunshankeji2 小时前
交通事故自动识别_YOLO11分割_DRB实现
python
小呀小萝卜儿3 小时前
2025-11-14 学习记录--Python-特征归一化方法(Min-Max或StandardScaler)
开发语言·python·学习
顾安r3 小时前
11.14 脚本网页 青蛙过河
服务器·前端·python·游戏·html
测试19983 小时前
如何用Appium实现移动端UI自动化测试?
自动化测试·软件测试·python·测试工具·ui·职场和发展·appium
Python私教3 小时前
第一个Python金融爬虫
爬虫·python·金融