目录
[(一)分类任务 vs 检测任务](#(一)分类任务 vs 检测任务)
[四、TP / FP / FN 的定义](#四、TP / FP / FN 的定义)
[(一)TP(True Positive)](#(一)TP(True Positive))
[(二)FP(False Positive)](#(二)FP(False Positive))
[(三)FN(False Negative)](#(三)FN(False Negative))
[(四)TN(True Negative)](#(四)TN(True Negative))
[七、Precision vs Recall 的权衡](#七、Precision vs Recall 的权衡)
[九、AP(Average Precision)](#九、AP(Average Precision))
[十、mAP(mean Average Precision)](#十、mAP(mean Average Precision))
[十一、mAP@0.5 vs mAP@0.5:0.95](#十一、mAP@0.5 vs mAP@0.5:0.95)
[十四、F1 Score(综合指标)](#十四、F1 Score(综合指标))
一、前言
在工业视觉系统中,目标检测模型不仅要"能用",更要"可靠"。
例如在产线检测中:
-
检测漏掉一个缺陷 → 可能造成质量事故
-
误检一个正常产品 → 降低生产效率
-
定位偏差过大 → 影响后续自动化处理
因此,仅仅看"准确率"远远不够。
目标检测需要一套更加复杂、更加工程化的评估体系:
目标检测评估指标体系
本文将系统讲清工业领域最重要的检测评估指标,包括 IoU、Precision、Recall、AP、mAP 等核心概念。
二、为什么目标检测不能只看Accuracy
(一)分类任务 vs 检测任务
分类任务
Image → Class
评估:
Accuracy 足够
目标检测任务
Image → Class + Box
不仅要判断:
-
对不对
-
还要判断位置准不准
(二)关键问题
目标检测评价必须解决三个问题:
1. 有没有检测到
2. 检测得准不准
3. 是否重复检测
三、IoU:目标检测的基础指标
(一)IoU定义
IoU=\frac{Area\ of\ Overlap}{Area\ of\ Union}
(二)直观理解
IoU衡量:
预测框与真实框的重叠程度
(三)示意解释
-
IoU = 1:完全重合
-
IoU = 0:完全不重叠
(四)工业常用阈值
| 场景 | IoU阈值 |
|---|---|
| 通用检测 | 0.5 |
| 工业检测 | 0.5 ~ 0.75 |
| 高精度检测 | 0.75+ |
四、TP / FP / FN 的定义
目标检测评估的核心基础。
(一)TP(True Positive)
检测正确 + 位置正确
(二)FP(False Positive)
检测到了,但错了(误检)
(三)FN(False Negative)
没有检测到(漏检)
(四)TN(True Negative)
在检测任务中通常不使用。
五、Precision(精确率)
(一)定义
Precision=\frac{TP}{TP+FP}
(二)含义
预测为正的样本中,有多少是真的
(三)工业意义
Precision高意味着:
误报少
(四)适用场景
-
安防系统
-
工业缺陷检测(减少误判)
六、Recall(召回率)
(一)定义
Recall=\frac{TP}{TP+FN}
(二)含义
所有真实目标中,有多少被检测出来
(三)工业意义
Recall高意味着:
漏检少
(四)适用场景
-
安全检测
-
医疗检测
-
缺陷检测(更重要)
七、Precision vs Recall 的权衡
(一)矛盾关系
Precision ↑ → Recall ↓(可能)
Recall ↑ → Precision ↓(可能)
(二)工业策略
| 场景 | 优先指标 |
|---|---|
| 工业质检 | Recall优先 |
| 安防识别 | Precision优先 |
| 自动驾驶 | 平衡 |
八、Precision-Recall曲线(PR曲线)
(一)定义
通过改变置信度阈值,得到:
Precision vs Recall 曲线
(二)作用
用于评估模型整体性能。
九、AP(Average Precision)
(一)定义
AP是PR曲线下的面积:
AP = PR曲线面积
(二)含义
单类别检测能力
(三)计算思想
在不同Recall下计算Precision平均值。
十、mAP(mean Average Precision)
(一)定义
mAP=\frac{1}{C}\sum_{i=1}^{C} AP_i
(二)含义
所有类别AP的平均值
(三)工业最重要指标
mAP是:
目标检测的核心评价标准
(四)不同版本
| 指标 | 说明 |
|---|---|
| mAP@0.5 | IoU=0.5 |
| mAP@0.5:0.95 | 多IoU平均 |
十一、mAP@0.5 vs mAP@0.5:0.95
(一)mAP@0.5
宽松标准
(二)mAP@0.5:0.95
严格标准(COCO标准)
(三)工业选择
| 场景 | 推荐 |
|---|---|
| 工业检测 | mAP@0.5 |
| 学术评估 | mAP@0.5:0.95 |
十二、IoU在评估中的作用
IoU用于判断:
预测框是否正确
(一)判定规则
IoU ≥ 阈值 → TP
IoU < 阈值 → FP
十三、NMS与评估关系
(一)NMS作用
去除重复框
(二)问题
如果NMS不好:
FP增加 → Precision下降
十四、F1 Score(综合指标)
(一)定义
F1=2\cdot\frac{Precision\cdot Recall}{Precision+Recall}
(二)意义
综合衡量:
Precision + Recall
十五、工业场景指标选择策略
(一)缺陷检测
重点:
Recall优先
(二)安防系统
重点:
Precision优先
(三)自动驾驶
重点:
Precision + Recall 平衡
十六、常见评估误区
(一)只看mAP
忽略:
-
漏检率
-
小目标表现
(二)忽略IoU阈值
不同IoU差异巨大。
(三)忽略类别不平衡
少数类性能被掩盖。
十七、目标检测评估流程总结
预测框
↓
计算IoU
↓
匹配GT
↓
计算TP / FP / FN
↓
Precision / Recall
↓
PR曲线
↓
AP
↓
mAP
十八、工业目标检测评估体系总结
目标检测评估体系本质是:
一个多层级、多指标的综合评价系统
核心指标包括:
-
IoU(定位质量)
-
Precision(误检控制)
-
Recall(漏检控制)
-
AP(单类能力)
-
mAP(整体能力)
-
F1(综合平衡)
十九、总结
目标检测评估指标是工业视觉系统中最关键的组成部分之一,它不仅决定模型"看起来好不好",更决定模型"能不能真正上线"。
本文系统讲解了:
1、为什么不能用Accuracy评估检测任务;
2、IoU核心概念;
3、TP/FP/FN定义;
4、Precision与Recall;
5、PR曲线与AP;
6、mAP指标体系;
7、IoU阈值影响;
8、NMS与评估关系;
9、工业场景指标选择;
10、完整评估流程。
可以将目标检测评估体系理解为:
"一个从空间定位质量(IoU)到分类准确性(Precision/Recall),再到整体性能(mAP)的多维度评价系统,是工业视觉系统可靠性的核心标尺。"
掌握这些指标,才能真正理解目标检测模型在工业中的实际价值。