决定系数(R²分数)——评估回归模型性能的一个指标

目录

1.定义

2.计算举例

[3. 结果分析](#3. 结果分析)


1.定义

R²(R平方)分数,也称为决定系数,是用来评估回归模型性能的一个指标。它表示自变量解释因变量变异性的比例。R²分数的取值范围通常在0到1之间,其值越接近1,说明模型拟合效果越好。

R²分数的计算公式如下:

其中:

  • 表示残差平方和(Residual Sum of Squares),即实际值与预测值之间的差异的平方和。
  • 表示总平方和(Total Sum of Squares),即实际值与均值之间的差异的平方和。

具体来说, 的计算方式如下:

其中:

  • 是第 i 个样本的实际值。
  • 是第 i 个样本的预测值。
  • 是所有实际值的平均值。
  • n 是样本的数量。

2.计算举例

假设我们有一个简单的数据集,包含3个样本点:

样本 实际值 (y) 预测值 ()
1 3 2.5
2 5 4.8
3 7 6.9

首先计算

  1. 计算

2.计算

3.计算

4.最后计算

因此,该模型的 分数为 0.9625,表明模型对数据的拟合效果很好。

3. 结果分析

  • 接近1时,说明模型能够很好地解释数据的变化。
  • 接近0时,说明模型的预测能力较差。
  • 如果模型总是预测一个常数值(例如,所有样本的平均值),那么 将为0。
  • 如果模型的预测值总是等于实际值,那么 将为1。
相关推荐
木非哲1 小时前
机器学习--随机森林--从一棵树的直觉到一片林的哲学
人工智能·随机森林·机器学习
A尘埃2 小时前
保险公司车险理赔欺诈检测(随机森林)
算法·随机森林·机器学习
小瑞瑞acd6 小时前
【小瑞瑞精讲】卷积神经网络(CNN):从入门到精通,计算机如何“看”懂世界?
人工智能·python·深度学习·神经网络·机器学习
民乐团扒谱机7 小时前
【微实验】机器学习之集成学习 GBDT和XGBoost 附 matlab仿真代码 复制即可运行
人工智能·机器学习·matlab·集成学习·xgboost·gbdt·梯度提升树
Σίσυφος19007 小时前
PCL法向量估计 之 RANSAC 平面估计法向量
算法·机器学习·平面
rcc86288 小时前
AI应用核心技能:从入门到精通的实战指南
人工智能·机器学习
霖大侠8 小时前
【无标题】
人工智能·深度学习·机器学习
B站_计算机毕业设计之家8 小时前
猫眼电影数据可视化与智能分析平台 | Python Flask框架 Echarts 推荐算法 爬虫 大数据 毕业设计源码
python·机器学习·信息可视化·flask·毕业设计·echarts·推荐算法
deephub9 小时前
机器学习特征工程:分类变量的数值化处理方法
python·机器学习·特征工程·分类变量
墩墩冰9 小时前
计算机图形学 实现直线段的反走样
人工智能·机器学习