决定系数(R²分数)——评估回归模型性能的一个指标

目录

1.定义

2.计算举例

[3. 结果分析](#3. 结果分析)


1.定义

R²(R平方)分数,也称为决定系数,是用来评估回归模型性能的一个指标。它表示自变量解释因变量变异性的比例。R²分数的取值范围通常在0到1之间,其值越接近1,说明模型拟合效果越好。

R²分数的计算公式如下:

其中:

  • 表示残差平方和(Residual Sum of Squares),即实际值与预测值之间的差异的平方和。
  • 表示总平方和(Total Sum of Squares),即实际值与均值之间的差异的平方和。

具体来说, 的计算方式如下:

其中:

  • 是第 i 个样本的实际值。
  • 是第 i 个样本的预测值。
  • 是所有实际值的平均值。
  • n 是样本的数量。

2.计算举例

假设我们有一个简单的数据集,包含3个样本点:

样本 实际值 (y) 预测值 ()
1 3 2.5
2 5 4.8
3 7 6.9

首先计算

  1. 计算

2.计算

3.计算

4.最后计算

因此,该模型的 分数为 0.9625,表明模型对数据的拟合效果很好。

3. 结果分析

  • 接近1时,说明模型能够很好地解释数据的变化。
  • 接近0时,说明模型的预测能力较差。
  • 如果模型总是预测一个常数值(例如,所有样本的平均值),那么 将为0。
  • 如果模型的预测值总是等于实际值,那么 将为1。
相关推荐
Narrastory17 小时前
最大似然估计,香农熵,交叉熵与KL散度的详细解读与实现
人工智能·机器学习
GIS数据转换器18 小时前
空天地一体化边坡监测及安全预警系统
大数据·人工智能·安全·机器学习·3d·无人机
AI科技星18 小时前
统一场论框架下万有引力常数的量子几何涌现与光速关联
数据结构·人工智能·算法·机器学习·重构
救救孩子把18 小时前
中文命名实体识别(NER)数据集全面整理
人工智能·机器学习·数据集
Christo319 小时前
2024《Three-way clustering: Foundations, survey and challenges》
人工智能·算法·机器学习·数据挖掘
薛不痒20 小时前
机器学习算法之集成学习随机森林和贝叶斯
算法·机器学习·集成学习
艾醒(AiXing-w)20 小时前
大模型原理剖析——多头潜在注意力 (MLA) 详解
人工智能·机器学习
Christo321 小时前
2022-《Deep Clustering: A Comprehensive Survey》
人工智能·算法·机器学习·数据挖掘
思通数据1 天前
市政道路无人机巡检:AI视觉技术的应用与挑战
人工智能·深度学习·安全·目标检测·机器学习·无人机·语音识别