吴恩达机器学习笔记 二十三 倾斜数据集的误差指标 精确率 召回率 精确率与召回率的平衡 F1分数

如果数据集的正例和反例的比例非常倾斜,常用的错误指标如 准确率(accuracy) 并不好用。此时可以用精确率和召回率。

精确率(precision):真阳的样本数/预测为阳的样本数=真阳数/(真阳+假阳)

召回率(recall):真阳/实际阳 = 真阳/(真阳+漏报)

相当于检测出的正有75%是真的正,能检测出的正大概占所有真的正样本的60%

假设 f(x) 大于等于0.5时为1, 小于0.5时为0.如果是一个罕见疾病的预测,我们希望只有在非常确定为 1 时才预测为 1 ,可以提高这个阈值 到 0.9, 此时精确率会提高,但召回率会下降

假设只有非常确定没有病的时候才预测为 0,可以降低这个阈值,此时精确率下降,但召回率会提高。(有点像"不放过一个")

根据精确率和召回率选择算法时,一种方法是计算二者的平均值,但这通常不好。计算F1分数可以结合精确率和召回率选择好算法。

F1分数(F1 score) :更倾向较低的数值,计算公式如下。这个公式在数学中被称为 P 和 R 的调和均值。

相关推荐
Surmon15 小时前
彻底搞懂大模型 Temperature、Top-p、Top-k 的区别!
前端·人工智能
见行AGV机器人17 小时前
无人机脉动线中的AGV小车
人工智能·无人机·agv·非标定制agv
廋到被风吹走17 小时前
【AI】从 OpenAI Codex 到 GitHub Copilot:AI 编程助手的技术演进脉络
人工智能·github·copilot
newsxun17 小时前
DHA之后,大脑营养进入GPC时代?
人工智能
程序员Better17 小时前
2026年AI大模型选择指南:8大主流模型深度对比,小白秒懂如何选!
人工智能
ai_xiaogui17 小时前
AIStarter新版后端原型图详解:架构全面升级+共享环境一键部署,本地AI模型插件工作流管理新时代来临(2026开发者必看)
人工智能·架构·推动开源ai落地·原型图细节·aistarter新版·aistarter新版原型图·架构全面升级+共享环境一键部署
2501_9269783317 小时前
“LLM的智能本质--AGI的可能路径--人类的意识本质”三者的统一基底(5.0理论解读)
人工智能·经验分享·笔记·深度学习·机器学习·ai写作·agi
拾光向日葵18 小时前
2026贵州高职专科报考全问答合集:专业、就业与实力大盘点
大数据·人工智能·物联网
لا معنى له18 小时前
WAM与AC-WM:具身智能时代的世界动作模型与动作条件世界模型
人工智能·笔记·学习
uzong18 小时前
AI Agent 是什么,如何理解它,未来挑战和思考
人工智能·后端·架构