sklearn实现一元线性回归——分析广告投入和销售额的关系

导入相关库

导入pandas

pandas是Python中用于数据处理和分析的核心库,提供DataFrame数据结构。常用于数据清洗、转换、统计分析等操作。

导入matplotlib.pyplot

matplotlib是Python基础绘图库,pyplot模块提供类似MATLAB的绘图接口。常用于生成折线图、散点图、直方图等可视化图表。

导入LinearRegression

scikit-learn中的线性回归模型,用于建立连续目标变量的预测模型。支持单变量和多变量回归分析。

python 复制代码
import pandas as pd#pandas基于numpy封装的
from matplotlib import pyplot as plt
from sklearn.linear_model import LinearRegression

读取文件

python 复制代码
data = pd.read_csv("data.csv")
a = data.广告投入

绘制散点图

python 复制代码
plt.scatter(data.广告投入, data.销售额)
plt.show()

估计模型参数,建立回归模型

python 复制代码
lr = LinearRegression()
x = data[['广告投入']]
y = data[['销售额']]

corr = data.corr()#求x和y的相关系数

训练模型

python 复制代码
lr.fit(x, y)

对回归模型进行检验

python 复制代码
result = lr.predict(x)
score = lr.score(x, y)
a = round(lr.intercept_[0],2)#查看截距
b = round(lr.coef_[0][0], 2)#查看斜率
print("线性回归模型为:y = {}x + {}.".format(b, a))

注意:此处的score指R方

利用回归模型进行预测

python 复制代码
predict = lr.predict([[40], [45], [50]])
print(predict)

结果如图:

增加可进行预测的代码

python 复制代码
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
data = pd.read_csv("data.csv",encoding="utf-8",engine='python')
print("数据基本信息:")
print(data[['广告投入', '销售额']].info())  # 检查数据类型是否为数值型
print("\n数据前5行:")
print(data[['广告投入', '销售额']].head())  # 检查数据格式是否正常

corr = data[['广告投入','销售额']].corr()
print(corr)

line_model = LinearRegression()
train_x = data[['广告投入']]
train_y = data['销售额']
train_x = np.array(train_x)
train_y = np.array(train_y)

line_model.fit(train_x,train_y)
score = line_model.score(train_x,train_y)

a = line_model.coef_
b = line_model.intercept_
print(f"y={a[0]:.2f}x+{b:2f}")

运行结果:

相关推荐
罗西的思考3 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab3 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab3 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
格砸5 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云5 小时前
可观测性 4.0:教系统如何思考
人工智能
sunny8655 小时前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github
小笼包包仔5 小时前
OpenClaw 多Agent软件开发最佳实践指南
人工智能
smallyoung6 小时前
AgenticRAG:智能体驱动的检索增强生成
人工智能
_skyming_6 小时前
OpenCode 如何做到结果不做自动质量评估,为什么结果还不错?
人工智能
南山安6 小时前
手写 Cursor 核心原理:从 Node.js 进程到智能 Agent
人工智能·agent·设计