机器学习的指标评价

之前在学校的小发明制作中,在终期答辩的时候,虽然整个项目的流程都答的很流畅。

在老师提问的过程中,当老师问我recall,precision,accuracy等指标是如何计算的,又能够表示模型的哪方面指标做得好。我听到这个问题的时候,就有点懵,因为我只知道,这些指标越接近1就代表模型越好,其他具体指哪方面好,我还是不知道,于是乎,在答辩完的下午,我就赶紧到图书馆,想把这一篇博客整理出来。

1,accuracy 准确率

准确率是衡量模型在所有样本中

(TP+TN)/(TP + FP + TN + FN)

通俗: 所有样本中预测正确的比例

2,精确率

精确率指的是模型正确预测为正例的样本与所有被分类为正例的比例(这个正分裂是模型判断的)

TP/(TP+FP)

通俗: 你认为正确的样本中预测正确的比例

3,召回率

模型成功预测出的正例样本占实际为正样本的比例

TP/(TP+FN)

正样本中有多少是被真正找出来的

4,F1 score

指的是精确率和召回率的调回平均值,综合考虑了模型的准确性和覆盖率。适合于不平衡类别的情况

F1 score = 2*(精确率*召回率)/(精确率+召回率)

TP (true positive) 真正例 即模型正确将正比例预测为正例的比例

FP(false positive)假正例 即模型错误地将负例预测为正例的比例

TN(true negative)真负例 即模型正确地将负例预测为负例的比例

FN(false negative)假负例 即模型错误地将正例判断为负例的比例

在混淆矩阵中具象化表示

相关推荐
TENSORTEC腾视科技几秒前
腾视科技TS-SG-SM7系列AI算力模组:32TOPS算力引擎,开启边缘智能新纪元
人工智能·ai·算力·ai算力模组·超低功耗·超强算力·灵活扩展
Deepoch7 分钟前
Deepoc 具身模型开发板:让农业除草机器人实现更稳定的自主作业
人工智能·机器人·开发板·具身模型·deepoc·除草
云栖梦泽在7 分钟前
AI安全入门:AI系统被攻击的常见场景与应对思路
大数据·人工智能·安全
zh路西法9 分钟前
【Qwen2.5本地部署】超简单pytorch-gpu部署教程
人工智能·pytorch·python
盼兮10 分钟前
用AI编程从零搭建一个响应式数据看板
前端·人工智能·数据可视化
轻刀快马11 分钟前
从马具到 AI 智能体的“外骨骼”:扒开 Harness 的底层进化史
人工智能
羊羊小栈12 分钟前
基于「YOLO目标检测 + 多模态AI分析」的水果蔬菜病害智能检测分析预警系统
人工智能·yolo·目标检测·计算机视觉·毕业设计·大作业
皮卡丘ZPC12 分钟前
GAIA2: BENCHMARKING LLM AGENTS ON DYNAMIC AND ASYNCHRONOUS ENVIRONMENTS
人工智能·语言模型·自然语言处理
weixin_4493108415 分钟前
小满OKKICRM与轻易云数据集成平台无缝对接
人工智能·小满
victory043116 分钟前
DeepSeek LLM Scaling Open-Source Language Models with Longtermism 中文翻译
人工智能·语言模型·自然语言处理