ROC曲线解读

问题

仔细看ROC曲线发现"奇怪"的问题: ROC曲线横纵坐标分别为假阳性率和真阳性率,但是当假阳性率越来越大的时候从曲线得到真阳性率也是越来越大?为什么不是一个增加一个减小呢

在ROC(Receiver Operating Characteristic)曲线中,横轴表示假阳性率 (False Positive Rate, FPR),纵轴表示真阳性率(True Positive Rate, TPR)。关于假阳性率和真阳性率的变化关系,实际上是与分类模型的预测阈值有关的。

  1. 假阳性率(FPR) :指的是所有负样本中被错误分类为正样本的比例,计算公式为:

    其中,FP是假阳性数(负样本被错分类为正样本),TN是真阴性数(负样本正确分类为负)。

  2. 真阳性率(TPR) :指的是所有正样本中被正确分类为正样本的比例,计算公式为:

    其中,TP是真阳性数(正样本被正确分类为正样本),FN是假阴性数(正样本被错分类为负样本)。

为什么FPR增加时TPR也增加?

ROC曲线展示了不同阈值下,模型的FPR和TPR的变化情况。当我们改变分类模型的阈值时:

  • 低阈值 :当我们将阈值设得很低时,几乎所有的样本都会被预测为正类,这样假阳性率 (FPR)就会变得非常高,因为很多负样本被错误地预测为正类。而真阳性率(TPR)也会很高,因为大部分正样本会被正确预测为正类。

  • 高阈值 :当我们将阈值设得很高时,只有那些置信度非常高的样本才会被预测为正类,这样假阳性率 会下降,因为预测为正类的负样本减少了。但是,真阳性率也会降低,因为一些原本应该被正确分类为正类的样本现在被误判为负类。

在ROC曲线的变化过程中,假阳性率和真阳性率通常是同步变化的。当放宽阈值,使得更多的样本被预测为正类时,假阳性率和真阳性率都会增加。相反,当提高阈值时,二者都减小。

相关推荐
Lee川38 分钟前
mini-cursor 揭秘:从 Tool 定义到 Agent 循环的完整实现
前端·人工智能·后端
weelinking1 小时前
【产品】00_产品经理用Claude实现产品系列介绍
数据库·人工智能·sql·数据挖掘·github·产品经理
Agent产品评测局1 小时前
制造业模具管理AI系统,主流产品能力对比详解:2026年智能制造选型深度洞察
人工智能·ai·chatgpt·制造
研华科技Advantech2 小时前
如何用一套实训设备,打通工业AI预测性维护技术全流程?
人工智能
Lab_AI2 小时前
AI for Science: MaXFlow AI Agent+ 报告体验双升级,让AI智能体更高效易用!
人工智能·ai for science·ai agent·ai智能体
李坤2 小时前
让 Codex 和 Claude 互相 Review:告别手动复制
人工智能·openai·claude
南屹川2 小时前
【API设计】GraphQL实战:从REST到GraphQL的演进
人工智能
KJ_BioMed2 小时前
当计算生物学遇上生成式AI:从头设计生物分子的“新范式”初探
人工智能·从头设计·生命科学·生物医药·科研干货·科晶生物
明月醉窗台2 小时前
深度学习(17)YOLO训练中的超参数详解
人工智能·深度学习·yolo
淘矿人2 小时前
Claude辅助DevOps实践
java·大数据·运维·人工智能·算法·bug·devops