sklearn实现一元线性回归——分析广告投入和销售额的关系

导入相关库

导入pandas

pandas是Python中用于数据处理和分析的核心库,提供DataFrame数据结构。常用于数据清洗、转换、统计分析等操作。

导入matplotlib.pyplot

matplotlib是Python基础绘图库,pyplot模块提供类似MATLAB的绘图接口。常用于生成折线图、散点图、直方图等可视化图表。

导入LinearRegression

scikit-learn中的线性回归模型,用于建立连续目标变量的预测模型。支持单变量和多变量回归分析。

python 复制代码
import pandas as pd#pandas基于numpy封装的
from matplotlib import pyplot as plt
from sklearn.linear_model import LinearRegression

读取文件

python 复制代码
data = pd.read_csv("data.csv")
a = data.广告投入

绘制散点图

python 复制代码
plt.scatter(data.广告投入, data.销售额)
plt.show()

估计模型参数,建立回归模型

python 复制代码
lr = LinearRegression()
x = data[['广告投入']]
y = data[['销售额']]

corr = data.corr()#求x和y的相关系数

训练模型

python 复制代码
lr.fit(x, y)

对回归模型进行检验

python 复制代码
result = lr.predict(x)
score = lr.score(x, y)
a = round(lr.intercept_[0],2)#查看截距
b = round(lr.coef_[0][0], 2)#查看斜率
print("线性回归模型为:y = {}x + {}.".format(b, a))

注意:此处的score指R方

利用回归模型进行预测

python 复制代码
predict = lr.predict([[40], [45], [50]])
print(predict)

结果如图:

增加可进行预测的代码

python 复制代码
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
data = pd.read_csv("data.csv",encoding="utf-8",engine='python')
print("数据基本信息:")
print(data[['广告投入', '销售额']].info())  # 检查数据类型是否为数值型
print("\n数据前5行:")
print(data[['广告投入', '销售额']].head())  # 检查数据格式是否正常

corr = data[['广告投入','销售额']].corr()
print(corr)

line_model = LinearRegression()
train_x = data[['广告投入']]
train_y = data['销售额']
train_x = np.array(train_x)
train_y = np.array(train_y)

line_model.fit(train_x,train_y)
score = line_model.score(train_x,train_y)

a = line_model.coef_
b = line_model.intercept_
print(f"y={a[0]:.2f}x+{b:2f}")

运行结果:

相关推荐
华东设计之美2 小时前
muti-Agent+RAG+KnowledgeGraph构建智能问诊系统的可行性分析
人工智能·软件开发·rag·大模型应用·增强检索生成
Luhui Dev2 小时前
幻觉不是 AI 的病,而是智能的宿命
人工智能
HyperAI超神经2 小时前
活动回顾丨 北大/清华/Zilliz/MoonBit共话开源,覆盖视频生成/视觉理解/向量数据库/AI原生编程语言
人工智能·ai·开源·编程语言·向量数据库·视频生成·视觉理解
智元视界2 小时前
AI情绪识别技术:发展、挑战与未来
人工智能·科技·数字化转型·产业升级
一水鉴天2 小时前
整体设计 定稿 备忘录仪表盘方案 之3 改造 为 “整体设计”的完整方案(初稿)之4 多子项目协同中枢 V1 (豆包助手)
人工智能·架构
前端不太难2 小时前
RN 图像处理(裁剪、压缩、滤镜)性能很差怎么办?
图像处理·人工智能
极客BIM工作室2 小时前
阿里WAN大模型:通义万相视频生成系统
人工智能
min1811234562 小时前
电商 AI 设计革命:2 小时生成商品主图,点击率提升 35% 的实践
人工智能
AI360labs_atyun2 小时前
呼吸疾病+AI,人工智能正在改变慢病治疗
人工智能·科技·学习·ai