机器学习-第三章 线性模型

3.1 线性模型

例题3.1

python 复制代码
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score
# -------------------------- 新增:解决中文字体问题 --------------------------
plt.rcParams["font.sans-serif"] = ["Microsoft YaHei"]  # 使用系统自带的微软雅黑字体
plt.rcParams["axes.unicode_minus"] = False  # 避免负号显示为方块
# 1. 准备数据(月广告费和月销售量,单位:万元)
# 月广告费数据
advertising = np.array([10.95, 12.14, 13.22, 13.87, 15.06, 16.30, 17.01, 17.93, 19.01, 20.01,
                        21.04, 22.10, 23.17, 24.07, 25.00, 25.95, 27.10, 28.01, 29.06, 30.05])
# 月销售量数据
sales = np.array([11.18, 10.43, 12.36, 14.15, 15.73, 16.40, 18.86, 16.13, 18.21, 18.37,
                  22.61, 19.83, 22.67, 22.70, 25.16, 25.55, 28.21, 28.12, 28.32, 29.18])

# 转换为二维数组(sklearn要求输入为[样本数, 特征数]格式)
X = advertising.reshape(-1, 1)  # 自变量:月广告费
y = sales.reshape(-1, 1)        # 因变量:月销售量

# 2. 训练线性回归模型
model = LinearRegression()
model.fit(X, y)  # 拟合模型

# 3. 获取模型参数
a = model.coef_[0][0]  # 斜率(权重)
b = model.intercept_[0]  # 截距
y_pred = model.predict(X)  # 预测值
r2 = r2_score(y, y_pred)  # 决定系数R²

# 4. 输出结果分析
print(f"线性回归方程:y = {a:.3f}x + {b:.3f}")
print(f"决定系数R²:{r2:.4f}(越接近1,拟合效果越好)")
print("\n模型解读:")
print(f"- 斜率{a:.3f}表示:月广告费每增加1万元,月销售量平均增加{a:.3f}万元")
print(f"- 截距{b:.3f}表示:当广告费为0时,销售量的基准值约为{b:.3f}万元")

# 5. 可视化拟合结果
plt.figure(figsize=(10, 6))
# 绘制原始数据点
plt.scatter(X, y, color='blue', label='原始数据', alpha=0.7)
# 绘制回归直线
plt.plot(X, y_pred, color='red', linewidth=2, label=f'回归直线: y={a:.3f}x+{b:.3f}')
# 添加标签和标题
plt.xlabel('月广告费(万元)', fontsize=12)
plt.ylabel('月销售量(万元)', fontsize=12)
plt.title('月广告费与月销售量的线性回归分析', fontsize=14)
plt.grid(alpha=0.3)
plt.legend(fontsize=12)
plt.show()

线性回归方程:y = 0.994x + -0.220

决定系数R²:0.9642(越接近1,拟合效果越好)

模型解读:

  • 斜率0.994表示:月广告费每增加1万元,月销售量平均增加0.994万元

  • 截距-0.220表示:当广告费为0时,销售量的基准值约为-0.220万元

相关推荐
l1t30 分钟前
利用DeepSeek辅助拉取GitHub存储库目录跳过特定文件方法
人工智能·github·deepseek
123445237 分钟前
Agent入门实战-一个题目生成Agent
人工智能·后端
IT_陈寒39 分钟前
Java性能调优实战:5个被低估却提升30%效率的JVM参数
前端·人工智能·后端
快手技术40 分钟前
AAAI 2026|全面发力!快手斩获 3 篇 Oral,12 篇论文入选!
前端·后端·算法
taihexuelang42 分钟前
大模型部署
人工智能·docker·容器
颜酱42 分钟前
前端算法必备:滑动窗口从入门到很熟练(最长/最短/计数三大类型)
前端·后端·算法
轻竹办公PPT43 分钟前
2025实测!AI生成PPT工具全总结
人工智能·python·powerpoint
做科研的周师兄44 分钟前
【MATLAB 实战】栅格数据 K-Means 聚类(分块处理版)—— 解决大数据内存溢出、运行卡顿问题
人工智能·算法·机器学习·matlab·kmeans·聚类
彼岸花开了吗44 分钟前
构建AI智能体:八十一、SVD模型压缩的艺术:如何科学选择K值实现最佳性能
人工智能·python·llm
X在敲AI代码1 小时前
leetcodeD3
数据结构·算法