回归模型拟合效果的统计指标: 决定系数 R2 r2 r2_score

决定系数 (Coefficient of Determination),通常用 R 2 R^2 R2 表示,是一种衡量回归模型拟合效果的统计量。它表示模型解释自变量和因变量之间变异程度的比例。决定系数的值在 [ 0 , 1 ] [0, 1] [0,1] 之间,值越接近 1,模型的拟合效果越好。

决定系数的计算公式:

R 2 = 1 − SSR SST R^2 = 1 - \frac{\text{SSR}}{\text{SST}} R2=1−SSTSSR

其中:

  • SSR(残差平方和) :模型的预测值与真实值之间误差的平方和,即:
    SSR = ∑ i = 1 n ( y i − y ^ i ) 2 \text{SSR} = \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 SSR=i=1∑n(yi−y^i)2

    其中, y i y_i yi 是实际值, y ^ i \hat{y}_i y^i 是预测值。

  • SST(总平方和) :实际值与其平均值之间的差异的平方和,即:
    SST = ∑ i = 1 n ( y i − y ˉ ) 2 \text{SST} = \sum_{i=1}^{n} (y_i - \bar{y})^2 SST=i=1∑n(yi−yˉ)2

    其中, y ˉ \bar{y} yˉ 是实际值的平均值。

决定系数的解释:

  1. R² = 1:表示模型完美拟合数据,即所有实际值都被模型准确预测。
  2. R² = 0:表示模型的预测效果与简单的平均值预测效果相同。即,模型没有解释因变量的变异。
  3. R² < 0 :当模型的预测值比平均值预测得更差时, R 2 R^2 R2 可以为负数,这表示模型没有任何解释能力。

决定系数的意义:

  • 决定系数可以用来衡量模型对数据的解释力。较高的 R 2 R^2 R2 表明模型较好地解释了数据中的变异,但它不能直接说明模型是否是最优模型,或是否适合所有情况。
  • R 2 R^2 R2 仅衡量线性关系的好坏,对于非线性回归模型,可能需要使用其他性能度量指标(如调整后的 R 2 R^2 R2、AIC、BIC 等)。

示例:如何解释 R 2 R^2 R2

假设在一个简单的线性回归中, R 2 = 0.85 R^2 = 0.85 R2=0.85,这意味着模型可以解释 85% 的数据变异,而剩余的 15% 可能是由于其他未被模型捕捉的因素导致的误差。

总结来说,决定系数 R 2 R^2 R2 是用于评估回归模型性能的重要指标,特别是衡量模型对数据中变异的解释能力。

相关推荐
B博士19 分钟前
科研进展 | JAG: 大光斑高光谱激光雷达遥感辐射传输模型从垂直视角解锁森林叶绿素分布密码
人工智能·jag·高光谱激光雷达·森林分层叶绿素诊断
Yao.Li1 小时前
PVN3D ORT CUDA Custom Ops 实现与联调记录
人工智能·3d·具身智能
诺伦1 小时前
LocalClaw 在智能制造的新机会:6部门AI+电商政策下的工厂AI升级方案
人工智能·制造
小陈工3 小时前
Python Web开发入门(十七):Vue.js与Python后端集成——让前后端真正“握手言和“
开发语言·前端·javascript·数据库·vue.js·人工智能·python
墨染天姬7 小时前
【AI】端侧AIBOX可以部署哪些智能体
人工智能
AI成长日志7 小时前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
2501_948114248 小时前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
小小工匠8 小时前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式
人工智能·ui
黎阳之光8 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
小超同学你好8 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注
人工智能·语言模型