吴恩达机器学习笔记 二十三 倾斜数据集的误差指标 精确率 召回率 精确率与召回率的平衡 F1分数

如果数据集的正例和反例的比例非常倾斜,常用的错误指标如 准确率(accuracy) 并不好用。此时可以用精确率和召回率。

精确率(precision):真阳的样本数/预测为阳的样本数=真阳数/(真阳+假阳)

召回率(recall):真阳/实际阳 = 真阳/(真阳+漏报)

相当于检测出的正有75%是真的正,能检测出的正大概占所有真的正样本的60%

假设 f(x) 大于等于0.5时为1, 小于0.5时为0.如果是一个罕见疾病的预测,我们希望只有在非常确定为 1 时才预测为 1 ,可以提高这个阈值 到 0.9, 此时精确率会提高,但召回率会下降

假设只有非常确定没有病的时候才预测为 0,可以降低这个阈值,此时精确率下降,但召回率会提高。(有点像"不放过一个")

根据精确率和召回率选择算法时,一种方法是计算二者的平均值,但这通常不好。计算F1分数可以结合精确率和召回率选择好算法。

F1分数(F1 score) :更倾向较低的数值,计算公式如下。这个公式在数学中被称为 P 和 R 的调和均值。

相关推荐
myq995 分钟前
第三章:Java异常处理
java·开发语言·笔记
Nautiluss9 分钟前
一起调试XVF3800麦克风阵列(三)
linux·人工智能·嵌入式硬件·音频·语音识别·dsp开发·智能音箱
ShenZhenDingYue10 分钟前
电力智能安全警示器全面解析:构建智能电力安全防护新体系
人工智能·输电线路·电力警示·有电危险
福客AI智能客服12 分钟前
AI客服软件:3C数码配件电商的售后精准适配与体验优化核心
人工智能
TDengine (老段)13 分钟前
从“被动养护”到“主动预警”,TDengine IDMP 让智慧桥梁靠数据“说话”
大数据·数据库·人工智能·物联网·时序数据库·tdengine·涛思数据
机器人行业研究员13 分钟前
破局与重构:2025年中国六维力传感器产业的价值升维之路
人工智能·机器人·人机交互·六维力传感器·关节力传感器
audyxiao00120 分钟前
AI一周重要会议和活动概览(12.29-1.4)
人工智能·acl·一周会议与活动·jcai
阿赵3D23 分钟前
JavaScript学习笔记——11、正则表达式
javascript·笔记·学习·正则表达式
愚公搬代码26 分钟前
【愚公系列】《扣子开发 AI Agent 智能体应用》023-实战案例:图文混合的火爆推文生成器
人工智能
Tan385129 分钟前
如何在 OfficeAI 上配置 API Key(图文教程)
开发语言·人工智能·c#·api·教程·officeai