ROC曲线解读

问题

仔细看ROC曲线发现"奇怪"的问题: ROC曲线横纵坐标分别为假阳性率和真阳性率,但是当假阳性率越来越大的时候从曲线得到真阳性率也是越来越大?为什么不是一个增加一个减小呢

在ROC(Receiver Operating Characteristic)曲线中,横轴表示假阳性率 (False Positive Rate, FPR),纵轴表示真阳性率(True Positive Rate, TPR)。关于假阳性率和真阳性率的变化关系,实际上是与分类模型的预测阈值有关的。

  1. 假阳性率(FPR) :指的是所有负样本中被错误分类为正样本的比例,计算公式为:

    其中,FP是假阳性数(负样本被错分类为正样本),TN是真阴性数(负样本正确分类为负)。

  2. 真阳性率(TPR) :指的是所有正样本中被正确分类为正样本的比例,计算公式为:

    其中,TP是真阳性数(正样本被正确分类为正样本),FN是假阴性数(正样本被错分类为负样本)。

为什么FPR增加时TPR也增加?

ROC曲线展示了不同阈值下,模型的FPR和TPR的变化情况。当我们改变分类模型的阈值时:

  • 低阈值 :当我们将阈值设得很低时,几乎所有的样本都会被预测为正类,这样假阳性率 (FPR)就会变得非常高,因为很多负样本被错误地预测为正类。而真阳性率(TPR)也会很高,因为大部分正样本会被正确预测为正类。

  • 高阈值 :当我们将阈值设得很高时,只有那些置信度非常高的样本才会被预测为正类,这样假阳性率 会下降,因为预测为正类的负样本减少了。但是,真阳性率也会降低,因为一些原本应该被正确分类为正类的样本现在被误判为负类。

在ROC曲线的变化过程中,假阳性率和真阳性率通常是同步变化的。当放宽阈值,使得更多的样本被预测为正类时,假阳性率和真阳性率都会增加。相反,当提高阈值时,二者都减小。

相关推荐
InfiSight智睿视界3 分钟前
当老字号遇上AI:阳坊涮肉的数字化运营转型之路
大数据·人工智能·连锁店智能巡检
张3蜂5 分钟前
OpenClaw 深度解析:从个人 AI 助理到开源智能体平台
人工智能·开源
程序员欣宸6 分钟前
LangChain4j实战之十六:RAG (检索增强生成),Naive RAG
java·人工智能·ai·langchain4j
Dingdangcat866 分钟前
轮胎缺陷检测与分类系统基于solov2_r101_fpn_ms-3x_coco模型实现_fulltyre专项识别_1
人工智能·分类·数据挖掘
Ivanqhz7 分钟前
现代异构高性能计算(HPC)集群节点架构
开发语言·人工智能·后端·算法·架构·云计算·边缘计算
weixin_509138347 分钟前
探索智能体认知动力学:几何视角下的AI革命(系列博客第二期)
人工智能·机器学习·语义空间
Loo国昌9 分钟前
【大模型应用开发】第三阶段:深度解析检索增强生成(RAG)原理
人工智能·后端·深度学习·自然语言处理·transformer
ONLYOFFICE9 分钟前
ONLYOFFICE AI 插件新功能:轻松创建专属 AI 助手
人工智能·onlyoffice
audyxiao0019 分钟前
AI一周重要会议和活动概览(2.2-2.8)
人工智能·大模型·iclr·ccf·一周会议与活动
柠萌f10 分钟前
2026 素材趋势报告:为什么“素材工程能力”,正在决定品牌的投放天花板?
人工智能