机器学习的指标评价

之前在学校的小发明制作中,在终期答辩的时候,虽然整个项目的流程都答的很流畅。

在老师提问的过程中,当老师问我recall,precision,accuracy等指标是如何计算的,又能够表示模型的哪方面指标做得好。我听到这个问题的时候,就有点懵,因为我只知道,这些指标越接近1就代表模型越好,其他具体指哪方面好,我还是不知道,于是乎,在答辩完的下午,我就赶紧到图书馆,想把这一篇博客整理出来。

1,accuracy 准确率

准确率是衡量模型在所有样本中

(TP+TN)/(TP + FP + TN + FN)

通俗: 所有样本中预测正确的比例

2,精确率

精确率指的是模型正确预测为正例的样本与所有被分类为正例的比例(这个正分裂是模型判断的)

TP/(TP+FP)

通俗: 你认为正确的样本中预测正确的比例

3,召回率

模型成功预测出的正例样本占实际为正样本的比例

TP/(TP+FN)

正样本中有多少是被真正找出来的

4,F1 score

指的是精确率和召回率的调回平均值,综合考虑了模型的准确性和覆盖率。适合于不平衡类别的情况

F1 score = 2*(精确率*召回率)/(精确率+召回率)

TP (true positive) 真正例 即模型正确将正比例预测为正例的比例

FP(false positive)假正例 即模型错误地将负例预测为正例的比例

TN(true negative)真负例 即模型正确地将负例预测为负例的比例

FN(false negative)假负例 即模型错误地将正例判断为负例的比例

在混淆矩阵中具象化表示

相关推荐
J2虾虾几秒前
Spring AI Alibaba - 检索增强生成(RAG)
人工智能·spring·原型模式
一切皆是因缘际会2 分钟前
底层重构与价值破壁人工智能产业变革
人工智能·安全·重构·系统架构
团象科技4 分钟前
企业出海本地化攻坚阶段 云端大模型微调的跨区域适配实践观察
大数据·人工智能
拾年2756 分钟前
一个月更 30 个版本!Claude Code 5 月核心更新,效率直接拉满
人工智能·ai编程·claude
罗小罗同学8 分钟前
Nat Med发表SPARK智能体框架,可以自主思考、提出假设、设计实验并验证结果,让AI也能主动发现肿瘤生物学规律
大数据·人工智能·spark·医学图像处理
一只奶龙8 分钟前
从0教你做一个AI编程智能体(一) · 智能体初识和搭建
人工智能
团象科技9 分钟前
跨境服务与产品多地域迭代场景下 生成式AI安全部署的实操路径观察
服务器·人工智能
YOLO数据集集合10 分钟前
无人机航拍人体检测数据集|低空巡检搜救智能监控|YOLO目标检测算法训练集
人工智能·深度学习·yolo·目标检测·无人机
逻辑君10 分钟前
Foresight研究报告【20260013】
人工智能·机器学习
明月照山海-11 分钟前
机器学习周报四十七
人工智能·机器学习