目标检测论文常用评价指标（Evaluation Metrics）总结

MickeyCV2024-09-26 15:30

评价指标（Evaluation Metrics）

- - 混淆矩阵（Confusion Matrix）
  - 归一化混淆矩阵（Normalized Confusion Matrix）
  - 精确度（Precision）
  - 召回率（Recall）
  - F1值（F1-Score）
  - 平均精确度（Average Precision, AP）
  - 平均精确度（Mean Average Precision, mAP）
  - 交并比（Intersection Over Union, IoU）
  - mAP50
  - mAP50-95
  - 检测时间（Detection Time）
  - 每秒帧率（Frames Per Second, FPS）

混淆矩阵（Confusion Matrix）

下面介绍四个概念：

真阳性（True Positive, TP）

TP：模型预测是行人，预测正确（实际是行人，而且也被模型预测为是行人）
真阴性（True Negative, TN）

TN：模型预测非行人，预测正确（实际不是行人，而且也被模型预测为非行人）
假阳性（False Positive, FP）

FP：模型预测是行人，预测错误（实际非行人，但是被模型预测为是行人）
假阴性（False Negative, FN）

FN：模型预测非行人，预测错误（实际是行人，但是被模型预测为非行人）

混淆矩阵是对检测结果的可视化概览，是一种用于评估和可视化分类模型性能的重要工具。它以表格形式展现，直观地显示了模型预测类别与实际类别之间的对应关系（即TP、TN、FP、FN）。

归一化混淆矩阵（Normalized Confusion Matrix）

混淆矩阵的归一化，就是对混淆矩阵所有数值整体做了归一化处理，即将每个单元格的值除以该类别实际样本数，从而得到表示分类准确率的百分比。这种标准化可以直观地比较类别间的分类准确率，并识别出模型在不同类别上表现的差异。在归一化混淆矩阵中，对角线颜色越深，代表该模型对于此数据集的各类别识别能力越强。

精确度（Precision）

在被分类器预测为正例的样本中有多少是正确的。

召回率（Recall）

在所有实际为正例的样本中有多少被分类器预测为正例。

F1值（F1-Score）

它是精确度和召回率的综合表现，当精确度和召回率出现难以权衡的时候使用。

平均精确度（Average Precision, AP）

用于计算不同类别的平均精确度。

平均精确度（Mean Average Precision, mAP）

多类别问题的平均精确度。

交并比（Intersection Over Union, IoU）

在目标检测中，它用于衡量模型生成的候选框与原标记框之间的重叠程度。
IoU值越大，表示两个框之间的相似性越高。通常，当IoU值大于0.5时，认为可以检测到目标物体。这个指标常用于评估模型在特定数据集上的检测准确度。

mAP50

定义：mAP50 是指 IoU 阈值固定为 0.5 时计算得到的平均精度均值。
特点：mAP50 更关注于检测框与真实框之间的重叠程度大于等于 50% 的情况。这意味着即使检测框与真实框的重叠程度较低，只要超过 50%，也会被视为正确检测。

mAP50-95

定义：mAP50-95 是指在 IoU 阈值从 0.5 到 0.95 之间，每隔 0.05 计算一次 AP（Average Precision），然后取这些 AP 的平均值。
特点：mAP50-95 更全面地考虑了不同重叠程度下的检测质量，这要求模型不仅能够检测出目标，还要确保检测框与真实框之间的重叠足够高。

检测时间（Detection Time）

预处理（Preprocess）：对输入数据进行初步处理的阶段。
推理（Inference）：模型实际运行的阶段，基于预处理后的数据执行前向传播计算。
损失计算（Loss）：损失计算主要用于训练阶段，评估模型输出与真实标签之间的差距。
后处理（Postprocess）：这是将模型的输出转化为可解释的结果的过程。

每秒帧率（Frames Per Second, FPS）

它用于评估模型在给定硬件上的处理速度，即每秒可以处理的图片数量，该指标对于实现实时检测非常重要，因为只有处理速度快，才能满足实时检测的需求。

上一篇：Qt笔记（十七）cmake编译Qt项目

下一篇：【CSS】定位

热门推荐

01UV安装并设置国内源 02KGG转MP3工具|非KGM文件|解密音频 03【2025.08.06最新版】Android Studio下载、安装及配置记录（自动下载sdk）04Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 05蜘蛛磁力搜索引擎大全，如何使用蜘蛛磁力查找磁力链接 062025最新国内服务器可用docker源仓库地址大全（2025年8月更新）07TRAE 规则（Rules）配置指南：个人习惯、团队规范与最佳实践 08NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 09全球最强模型Grok4，国内已可免费使用！（附教程）10TRAE Rules 实践：为项目配置 6A 工作流