2.7 ROC曲线相比P-R曲线有什么特点?

2.7 ROC曲线相比P-R曲线有什么特点?

前情提要:

P-R曲线详见:2.2 什么是精确率(Precision)与召回率(Recall)?二者如何权衡?

2.4 ROC曲线是什么?

2.5 如何绘制ROC曲线?

2.6 如何计算AUC?

P-R曲线和ROC曲线同样被经常用来评估分类和排序模型。

相比P-R曲线,ROC曲线有一个特点,当正负样本的分布发生变化时,

  • ROC曲线的形状能够基本保持不变

  • 而P-R 曲线的形状一般会发生较剧烈的变化。

举例来说,图2.3是ROC曲线和P-R曲线的对比图,

  • 其中图2.3(a)和图2.3( c )是ROC曲线,
  • 图2.3(b)和图2.3(d)是P-R 曲线,
  • 图2.3( c )和图2.3(d)则是将测试集中的负样本数量增加10倍后的曲线图。

​ 可以看出,P-R曲线发生了明显的变化,而ROC曲线形状基本不变。这个特点让ROC 曲线能够尽量降低不同测试集带来的干扰,更加客观地衡量模型本身的性能

这有什么实际意义呢?

​ 在很多实际问题中,正负样本数量往往很不均衡。比如,计算广告领域经常涉及转化率模型,正样本的数量往往是负样本数量的1/1000甚至1/10000。若选择不同的测试集,P-R 曲线的变化就会非常大,而ROC曲线则能够更加稳定地反映模型本身的好坏。所以,ROC 曲线的适用场景更多,被广泛用于排序、推荐、广告等领域。

​ 但需要注意的是,选择P-R 曲线还是ROC 曲线是因实际问题而异的,如果研究者希望更多地看到模型在特定数据集上的表现,P-R 曲线则能够更直观地反映其性能。

参考文献:

《百面机器学习》 诸葛越主编

出版社:人民邮电出版社(北京)

ISBN:978-7-115-48736-0

2022年8月第1版(2022年1月北京第19次印刷)

相关推荐
B站计算机毕业设计之家17 小时前
大数据python招聘数据分析预测系统 招聘数据平台 +爬虫+可视化 +django框架+vue框架 大数据技术✅
大数据·爬虫·python·机器学习·数据挖掘·数据分析
落羽的落羽18 小时前
【C++】现代C++的新特性constexpr,及其在C++14、C++17、C++20中的进化
linux·c++·人工智能·学习·机器学习·c++20·c++40周年
云雾J视界20 小时前
AI驱动半导体良率提升:基于机器学习的晶圆缺陷分类系统搭建
人工智能·python·机器学习·智能制造·数据驱动·晶圆缺陷分类
极客学术工坊1 天前
2023年第二十届五一数学建模竞赛-A题 无人机定点投放问题-基于抛体运动的无人机定点投放问题研究
人工智能·机器学习·数学建模·启发式算法
Theodore_10221 天前
深度学习(9)导数与计算图
人工智能·深度学习·机器学习·矩阵·线性回归
极客学术工坊1 天前
2022年第十二届MathorCup高校数学建模挑战赛-D题 移动通信网络站址规划和区域聚类问题
机器学习·数学建模·启发式算法·聚类
领航猿1号1 天前
Pytorch 内存布局优化:Contiguous Memory
人工智能·pytorch·深度学习·机器学习
hakuii1 天前
SVD分解后的各个矩阵的深层理解
人工智能·机器学习·矩阵
这张生成的图像能检测吗1 天前
(论文速读)基于图像堆栈的低频超宽带SAR叶簇隐蔽目标变化检测
图像处理·人工智能·深度学习·机器学习·信号处理·雷达·变化检测
Blossom.1181 天前
大模型在边缘计算中的部署挑战与优化策略
人工智能·python·算法·机器学习·边缘计算·pygame·tornado