吴恩达机器学习笔记 二十三 倾斜数据集的误差指标 精确率 召回率 精确率与召回率的平衡 F1分数

如果数据集的正例和反例的比例非常倾斜,常用的错误指标如 准确率(accuracy) 并不好用。此时可以用精确率和召回率。

精确率(precision):真阳的样本数/预测为阳的样本数=真阳数/(真阳+假阳)

召回率(recall):真阳/实际阳 = 真阳/(真阳+漏报)

相当于检测出的正有75%是真的正,能检测出的正大概占所有真的正样本的60%

假设 f(x) 大于等于0.5时为1, 小于0.5时为0.如果是一个罕见疾病的预测,我们希望只有在非常确定为 1 时才预测为 1 ,可以提高这个阈值 到 0.9, 此时精确率会提高,但召回率会下降

假设只有非常确定没有病的时候才预测为 0,可以降低这个阈值,此时精确率下降,但召回率会提高。(有点像"不放过一个")

根据精确率和召回率选择算法时,一种方法是计算二者的平均值,但这通常不好。计算F1分数可以结合精确率和召回率选择好算法。

F1分数(F1 score) :更倾向较低的数值,计算公式如下。这个公式在数学中被称为 P 和 R 的调和均值。

相关推荐
算法与编程之美2 小时前
探索多个卷积层的卷积神经网络
人工智能·深度学习·神经网络·机器学习·cnn
木枷2 小时前
多GPU和单GPU运行llama的时间差
人工智能·llama
老吴学AI2 小时前
2025 Generative AI in Professional Services Report
人工智能
Livingbody2 小时前
基于大模型的智能读报助手
人工智能
企智小茶馆3 小时前
AI新闻 2026年01月02日
人工智能
百锦再3 小时前
抖音小程序开发全景透视:生态解析、技术架构与商业实践
人工智能·ai·微信小程序·小程序·架构·模型·抖音
ZhuNian的学习乐园3 小时前
LLM对齐核心:RLHF 从基础到实践全解析
人工智能·python·算法
西瓜情怀总是籽3 小时前
回首2025,抬眸2026
人工智能
nwsuaf_huasir3 小时前
适合一维信号时间序列分割与窗口检测的问题的深度神经网络架构
人工智能·神经网络·dnn
&永恒的星河&3 小时前
告别过时预测!最新时序新SOTA:TimeFilter教会模型“选择性失明”
人工智能·深度学习·算法·时序预测·timefilter·时序算法