决定系数R2 浅谈三 : 决定系数R2与相关系数r的关系、决定系数R2是否等于相关系数r的平方

今天浅谈一下本人对决定系数R2相关系数r 的理解,我们在做回归分析、简单线性回归、多元线性回归、对模型进行算法训练时,常常会见到决定系数R2和相关系数r,在很多资料中对这两者的关系解释也是含糊不清,有的说决定系数R2就是等于相关系数r,有的说他两没有任何关系。那么两者到底有无关系请看我关于两者的一些讨论。

1 相关系数r(Correlation coefficient)

相关系数r的定义如下:

由以上定义式可知,相关系数r描述的时自变量 X与因变量Y之间的线性关系强度和方向

2 决定系数 R2(coefficient of determination)

决定系数R2衡量的是回归模型所能解释的变异量占总变异量 的比例,其中关于决定系数R2的定义可以参考我前面的文章,此处便不再定义,文章链接如下:决定系数R2 浅谈一 : 决定系数R2为什么计算出来小于0/为负数、大于1/远大于1、决定系数R2为什么计算出来不在0~1之间-CSDN博客

3 R2与r2的关系

两者何时才能等价呢,实际上决定系数R2和相关系数r2只有在简单线性回归 中才能是完全等价 的,此处的等价也仅限于 最后的结果相等

简单线性回归 指的就是一元线性回归,即一个自变量和一个因变量。

实际上,我们根据决定系数和相关系数的定义就可以得知,两者完全不是一个概念上的东西

1)决定系数的计算只跟预测值和观测值相关,说直白点,它最终的计算结果只与因变量Y相关。

2)相关系数的计算涉及到自变量和因变量,并未涉及到预测值。

3)相关系数r一般是在建模前对数据集中的自变量X和因变量Y进行一个相关性分析;

4)而决定系数R2是在对数据集建模后对预测值和观测值进行一个计算,来观察模型的预测效果,两者的计算目的都不相同。

4 结论

1)当模型是简单线性回归时(一元线性回归),决定系数R2的计算结果等于相关系数r的平方。

2)当模型涉及多个自变量(两个及以上)时,决定系数R2的计算结果等于相关系数r的平方两者计算结果不相等。

3)相关系数r反应的是自变量与因变量之间的线性程度;决定系数R2反应的是回归模型对数据集的拟合程度;两者并无联系。

以上也仅仅是个人总结的观点,具体证明可参考统计学的书籍和相关资料。

如有不足之处,还请各位批评指正!

记得点赞,收藏,关注一键三连,谢谢未来的各位工程师、教授、院士......!

相关推荐
程序员Linc12 分钟前
写给新人的深度学习扫盲贴:向量与矩阵
人工智能·深度学习·矩阵·向量
ゞ 正在缓冲99%…12 分钟前
leetcode76.最小覆盖子串
java·算法·leetcode·字符串·双指针·滑动窗口
xuanjiong13 分钟前
纯个人整理,蓝桥杯使用的算法模板day2(0-1背包问题),手打个人理解注释,超全面,且均已验证成功(附带详细手写“模拟流程图”,全网首个
算法·蓝桥杯·动态规划
go_bai23 分钟前
Linux环境基础开发工具——(2)vim
linux·开发语言·经验分享·笔记·vim·学习方法
吴梓穆32 分钟前
UE5学习笔记 FPS游戏制作35 使用.csv配置文件
笔记·学习·ue5
惊鸿.Jh32 分钟前
【滑动窗口】3254. 长度为 K 的子数组的能量值 I
数据结构·算法·leetcode
明灯L33 分钟前
《函数基础与内存机制深度剖析:从 return 语句到各类经典编程题详解》
经验分享·python·算法·链表·经典例题
databook34 分钟前
不平衡样本数据的救星:数据再分配策略
python·机器学习·scikit-learn
100分题库小程序38 分钟前
2025年机动车授权签字人考试判断题分享
经验分享·笔记
碳基学AI39 分钟前
哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义免费下载方法
大数据·人工智能·python·gpt·算法·语言模型·集成学习