TP、FP、FN、TN 详解

一、前言

在图像检测、文本分类、异常识别、AI 风控等二分类任务中,TP、FP、FN、TN 是评估模型好坏最基础、最核心的四个指标。看懂这四个值,就能算出准确率、精确率、召回率、F1 分数,快速判断模型漏检、误判问题。

二、基础定义(二分类判定规则)

设定两类:

  • 正样本 P:目标物体、异常、合格、阳性
  • 负样本 N:背景、正常、不合格、阴性

模型只有两种预测结果:预测为正、预测为负,两两组合得到四种结果:

符号 全称 中文名称 实际情况 模型预测 通俗理解
TP True Positive 真正例 正样本 预测正 猜对目标
FP False Positive 假正例 负样本 预测正 误判认错
FN False Negative 假负例 正样本 预测负 漏检漏掉
TN True Negative 真负例 负样本 预测负 猜对背景

预测正(P) 预测负(N)
实际正(P) TP✅ FN❌
实际负(N) FP❌ TN✅

三、四大核心评估指标计算公式

总样本数:\(Total = TP+FP+FN+TN\)

  1. 准确率 Accuracy整体判断正确的比例\(Accuracy=\frac{TP+TN}{TP+FP+FN+TN}\)

  2. 精确率 Precision 模型判定为正样本里,真正正确的比例,防误判\(Precision=\frac{TP}{TP+FP}\)

  3. 召回率 Recall 所有真实正样本中,被成功检出的比例,防漏检\(Recall=\frac{TP}{TP+FN}\)

  4. F1-Score精确率和召回率调和平均,综合衡量模型整体性能\(F1=\frac{2\times Precision\times Recall}{Precision+Recall}\)

四、F1-Score

F1分数:精确率与召回率的调和

当我们需要一个综合指标来平衡精确率和召回率时,F1分数就派上用场了。它综合反映了模型的稳健性。

定义:精确率和召回率的调和平均数,更强调二者的均衡性。

特点:取值范围 0,1,越接近1越好。它对P/R中的较低值非常敏感,仅当两者都较高时,F1分数才会高。适合样本不均衡或需兼顾质量与数量的场景。

相关推荐
Token炼金师15 小时前
目标的抉择:CLM 称王、MLM 退场、FIM 补刀、多 Token 与多语 —— 预训练目标五辩
人工智能·深度学习·预训练·clm·mlm·fim·mtp
星马梦缘15 小时前
机器学习与模式识别 第十三章 从线性模型到神经网络 考点压缩
人工智能·pytorch·神经网络·机器学习·激活函数·relu
one_love_zfl15 小时前
Claude Code 隐私检测事件情况说明及升级指南
人工智能
格子软件15 小时前
2026年分布式GEO代理流量调度:源码级状态机防重挂实战
java·vue.js·人工智能·spring boot·分布式·vue
小柒儿33615 小时前
量子通信产业化:从保密通信到全域应用,重构信息安全底层体系
人工智能·重构
手写码匠15 小时前
手写 LLM 安全护栏:从内容审核到越狱防御的完整实现
人工智能·深度学习·算法·aigc
AI科技星15 小时前
乖乖数学全域数学加速正电荷会产生反向引力
人工智能·机器学习·概率论·量子计算·乖乖数学·全域数学·引力
大囚长15 小时前
信息约简对智能系统预测的重要性
人工智能·深度学习·机器学习
A.说学逗唱的Coke15 小时前
【大模型专题】Qoder 实战指南:从安装到 Agents 自主开发全流程
人工智能·语言模型
俊哥V15 小时前
每日 AI 研究简报 · 2026-07-04
人工智能·ai