机器学习的指标评价

之前在学校的小发明制作中,在终期答辩的时候,虽然整个项目的流程都答的很流畅。

在老师提问的过程中,当老师问我recall,precision,accuracy等指标是如何计算的,又能够表示模型的哪方面指标做得好。我听到这个问题的时候,就有点懵,因为我只知道,这些指标越接近1就代表模型越好,其他具体指哪方面好,我还是不知道,于是乎,在答辩完的下午,我就赶紧到图书馆,想把这一篇博客整理出来。

1,accuracy 准确率

准确率是衡量模型在所有样本中

(TP+TN)/(TP + FP + TN + FN)

通俗: 所有样本中预测正确的比例

2,精确率

精确率指的是模型正确预测为正例的样本与所有被分类为正例的比例(这个正分裂是模型判断的)

TP/(TP+FP)

通俗: 你认为正确的样本中预测正确的比例

3,召回率

模型成功预测出的正例样本占实际为正样本的比例

TP/(TP+FN)

正样本中有多少是被真正找出来的

4,F1 score

指的是精确率和召回率的调回平均值,综合考虑了模型的准确性和覆盖率。适合于不平衡类别的情况

F1 score = 2*(精确率*召回率)/(精确率+召回率)

TP (true positive) 真正例 即模型正确将正比例预测为正例的比例

FP(false positive)假正例 即模型错误地将负例预测为正例的比例

TN(true negative)真负例 即模型正确地将负例预测为负例的比例

FN(false negative)假负例 即模型错误地将正例判断为负例的比例

在混淆矩阵中具象化表示

相关推荐
陈大鱼头12 分钟前
[译]费尽心思来保障 OpenClaw ?那跟直接用 GPT 有什么区别?
人工智能
Fleshy数模18 分钟前
玩转OpenCV:视频椒盐噪声处理与图像形态学操作实战
人工智能·opencv·音视频
幂律智能25 分钟前
Agent × 流程引擎融合架构:从静态流程到智能流程编排
人工智能·架构·agent
无垠的广袤33 分钟前
ChatECNU 大语言模型与 PicoClaw 部署
人工智能·语言模型·自然语言处理·嵌入式·树莓派
爱淋雨的男人44 分钟前
自动驾驶感知相关算法
人工智能·算法·自动驾驶
互联网科技看点1 小时前
AI算力爆发叠加数据资产风口,铂拉锐科技布局去中心化数字生态
人工智能·科技·去中心化
如若1231 小时前
flash-attn 安装失败?从报错到成功的完整排雷指南(CUDA 12.8 + PyTorch 2.7)
人工智能·pytorch·python
七牛云行业应用1 小时前
GPT-5.4能力前瞻:解析原生电脑操控(Computer Use)原理与Agent架构构建
人工智能·chatgpt·大语言模型·ai agent·mcp协议
带娃的IT创业者1 小时前
Prompt Engineering 进阶:让 AI 写出人类味道(完整指南)
人工智能·大模型·llm·prompt·写作技巧·ai 教学
简佐义的博客1 小时前
转录组数据分析实战,仅需99元(视频版)
大数据·人工智能·数据挖掘·数据分析·音视频