吴恩达机器学习笔记 二十三 倾斜数据集的误差指标 精确率 召回率 精确率与召回率的平衡 F1分数

如果数据集的正例和反例的比例非常倾斜,常用的错误指标如 准确率(accuracy) 并不好用。此时可以用精确率和召回率。

精确率(precision):真阳的样本数/预测为阳的样本数=真阳数/(真阳+假阳)

召回率(recall):真阳/实际阳 = 真阳/(真阳+漏报)

相当于检测出的正有75%是真的正,能检测出的正大概占所有真的正样本的60%

假设 f(x) 大于等于0.5时为1, 小于0.5时为0.如果是一个罕见疾病的预测,我们希望只有在非常确定为 1 时才预测为 1 ,可以提高这个阈值 到 0.9, 此时精确率会提高,但召回率会下降

假设只有非常确定没有病的时候才预测为 0,可以降低这个阈值,此时精确率下降,但召回率会提高。(有点像"不放过一个")

根据精确率和召回率选择算法时,一种方法是计算二者的平均值,但这通常不好。计算F1分数可以结合精确率和召回率选择好算法。

F1分数(F1 score) :更倾向较低的数值,计算公式如下。这个公式在数学中被称为 P 和 R 的调和均值。

相关推荐
Lw中2 分钟前
RAG如何科学调节切片长度与滑动窗口?
人工智能·大模型应用基础·rag检索
Σίσυφος19003 分钟前
对数极坐标相位相关 Log-Polar Phase Correlation
图像处理·人工智能·计算机视觉
Striver-Diligent8 分钟前
您的解决方案准确吗?一种用于增强通信网络可靠性的、面向故障的性能预测方法
网络·深度学习·机器学习·网络性能估计·数字孪生网络·网络预测
月落三千雪14 分钟前
Skill知识库知识库搭建教程(零基础通用版)
人工智能
陈天伟教授28 分钟前
人工智能应用- 机器做梦:02.回顾卷积神经网络
人工智能·神经网络·cnn
SuAluvfy36 分钟前
关于AI应用工程师
人工智能
liuyukuan1 小时前
5G-A与AI融合开启智能体互联网时代
人工智能·5g
高洁011 小时前
数据可视化实战:用AI工具制作专业数据分析图表
人工智能·python·深度学习·信息可视化·transformer
xjf77111 小时前
TypeDOM - AI 文档需求全景指南
人工智能·typedom·ai文档
ai产品老杨1 小时前
从黑盒到白盒:基于GB28181/RTSP全栈源码交付的AI视频平台OEM与低代码集成实践
人工智能·低代码