机器学习的指标评价

之前在学校的小发明制作中,在终期答辩的时候,虽然整个项目的流程都答的很流畅。

在老师提问的过程中,当老师问我recall,precision,accuracy等指标是如何计算的,又能够表示模型的哪方面指标做得好。我听到这个问题的时候,就有点懵,因为我只知道,这些指标越接近1就代表模型越好,其他具体指哪方面好,我还是不知道,于是乎,在答辩完的下午,我就赶紧到图书馆,想把这一篇博客整理出来。

1,accuracy 准确率

准确率是衡量模型在所有样本中

(TP+TN)/(TP + FP + TN + FN)

通俗: 所有样本中预测正确的比例

2,精确率

精确率指的是模型正确预测为正例的样本与所有被分类为正例的比例(这个正分裂是模型判断的)

TP/(TP+FP)

通俗: 你认为正确的样本中预测正确的比例

3,召回率

模型成功预测出的正例样本占实际为正样本的比例

TP/(TP+FN)

正样本中有多少是被真正找出来的

4,F1 score

指的是精确率和召回率的调回平均值,综合考虑了模型的准确性和覆盖率。适合于不平衡类别的情况

F1 score = 2*(精确率*召回率)/(精确率+召回率)

TP (true positive) 真正例 即模型正确将正比例预测为正例的比例

FP(false positive)假正例 即模型错误地将负例预测为正例的比例

TN(true negative)真负例 即模型正确地将负例预测为负例的比例

FN(false negative)假负例 即模型错误地将正例判断为负例的比例

在混淆矩阵中具象化表示

相关推荐
戴西软件20 小时前
戴西软件发布3DViz设计与仿真数据轻量化平台
大数据·人工智能·安全·机器学习·汽车
码农三叔20 小时前
(4-1)机械传动系统与关节设计:关节驱动方式对比
人工智能·架构·机器人·人形机器人
小汤圆不甜不要钱20 小时前
「Datawhale」RAG技术全栈指南 Task 3
人工智能·深度学习·机器学习·rag
AskHarries20 小时前
在 Qoder CLI 集成墨刀 MCP(modao-proto)完整指南
人工智能·ai编程
gs8014020 小时前
【保姆级】MetaGPT安装避坑指南:Windows+Conda环境下解决依赖冲突、版本过低及配置失效问题
人工智能·windows·conda·metagpt
INDEMIND20 小时前
实用化浪潮开启!消费级机器人从“能动”到“能用”,智能底层决定体验上限
人工智能·陪伴机器人·ces2026·消费级机器人
l1t20 小时前
DeepSeek总结的在单节点上处理 1TB Parquet 数据方法
数据库·人工智能·duckdb
一只落魄的蜂鸟20 小时前
【2026年-04期】Intelligent agent architecture
人工智能
咋吃都不胖lyh20 小时前
GBDT 回归任务生成过程(逐步计算演示)
人工智能·数据挖掘·回归
幻云201020 小时前
Next.js 之道:从入门到精通
前端·javascript·vue.js·人工智能·python