【目标检测基础篇】目标检测评价指标:mAP计算的超详细举例分析以及coco数据集标准详解(AP/AP50/APsmall.....))

学习视频:
霹雳吧啦Wz-目标检测mAP计算以及coco评价标准
【目标检测】指标介绍:mAP

1 TP/FP/FN

  • TP(True Positive) : IoU>0.5的检测框数量(同一Ground truth只计算一次)
  • FP(False Positive) : IoU<=0.5 的检测框(或者是检测到同一个GT的多余检测框的数量),误检的个数
  • FN(False Negative) : 没有检测到的GT的数量,漏检的目标的个数

1.1 举例分析

上面的图中有两只小猫,绿色的是他们的标注框,可以看到模型对于蝴蝶结小猫这个目标预测了两个目标框,分别为红框和黄框

  • 红色预测框和标注框的IOU>0.5,所以红框为TP
  • 黄色预测框和标注框的IOU<0.5,所以红框为FP
  • 模型对于铃铛小猫是没有预测出任何框的,所以为FN

2 Presion和Recall

  • Precision(查准率): 模型预测的所有目标(TP+FP)中,预测正确的(TP)比例 P r e c i s i o n = T P / ( T P + F P ) Precision = TP / (TP +FP) Precision=TP/(TP+FP)

  • Recall(查全率): 所有真实目标(TP+FN)中,预测正确(TP)的比例 R e c a l l = T P / ( T P + F N ) Recall = TP / (TP + FN) Recall=TP/(TP+FN),其中TP+FN = GT的个数,即图片中出现的所有预测框的个数

2.1 举例

仅凭借其中一个指标无法说明模型的好坏。

2.1.1 precision

图片中有5个目标,但是模型只检测出一个目标(1个红色框),没有其他任何的检测框,所以TP=1,FP=0,故P = 1,因此P高并不能说明模型检测效果好。

2.1.2 recall

假设模型一次给出了50个预测框,包括了图中的5个目标,故TP=5,由于没有漏检目标,故FN=0,因此recall=1,故R高也不能说明模型预测的好。

3 Average Precision

平均精度(Average Precision, AP) 是目标检测算法的热门衡量指标。衡量了模型对正样本的预测准确性。

通过在不同的召回率下计算并平均精确率 来得到,形成了一个曲线下的面积值。较高AP 值意味着模型具有更好的检测性能,而AP=1表示模型的检测是完美的。

  • AP: P-R曲线下面积
  • P-R曲线 : Precision-Recall曲线
  • mAP: mean Average Precision, 即各类别AP的平均值

3.1 举例分析

使用yolov5来进行预测,图片的标注为左图所示,yolov5预测的结果如右图所示,可以看到模型预测的有错误:没有预测到窗户里的人,错把一只小狗预测成了泰迪

原图中共有2+12+1+1=16个目标

由于平均精度(AP)是按照类别来计算的。那么下面先计算狗的平均精度。

步骤1: 首先列出狗类所有预测框的置信度并且判断是TP还是FP

步骤2:计算精确度和召回率

表格解释:Conf.置信度;Matches:是否为TP/FP;Cumulative TP:对TP数量进行累计;Cumulative FP:对FP数量进行累计;

其中GT的数量为16

步骤3 :绘制PR曲线

(未完待续)

4 CoCo数据集评价指标

可以看到CoCo数据集给出了比较多的评价指标,下面分析他们的具体含义。

4.1 Average Precision(AP)


A P AP AP:当IoU从0.5-0.95范围内取10个值(间隔0.05),计算到的AP的均值,CoCo最主要的评价指标

A P I o U = 0.5 AP^{IoU=0.5} APIoU=0.5:当iou取0.5时计算出的AP值

A P I o U = 0.75 AP^{IoU=0.75} APIoU=0.75:当iou取0.75时计算出的AP值,要求更为严格

4.2 AP Across Scales

A P s m a l l AP^{small} APsmall:针对小目标,目标像素面积<32平方
A P m e d i u m AP^{medium} APmedium:中等目标,32<目标像素面积<96
A P l a r g e AP^{large} APlarge:大目标,目标像素面积>96

4.3 Average Recall(AR)

A R m a x = 1 AR^{max=1} ARmax=1:每张图片只给出一个检测目标
A R m a x = 10 AR^{max=10} ARmax=10:每张图片给出10个检测目标
A R m a x = 100 AR^{max=100} ARmax=100:每张图片给出100个检测目标

4.4 AR Across Scales

A R s m a l l AR^{small} ARsmall:针对小目标,目标像素面积<32平方
A R P m e d i u m ARP^{medium} ARPmedium:中等目标,32<目标像素面积<96
A R l a r g e AR^{large} ARlarge:大目标,目标像素面积>96

相关推荐
roman_日积跬步-终至千里几秒前
【计算机视觉(18)】语义理解-CNN架构概览_VGG_Inception_ResNet
计算机视觉·架构·cnn
扫地的小何尚2 分钟前
NVIDIA CUDA-Q QEC权威指南:实时解码、GPU解码器与AI推理增强
人工智能·深度学习·算法·llm·gpu·量子计算·nvidia
hy15687864 分钟前
COZE编程-智能体-起飞起飞起飞(一句话生成智能体大升级)
人工智能·coze·自动编程
人工智能培训6 分钟前
深度学习初学者指南
人工智能·深度学习·群体智能·智能体·人工智能培训·智能体搭建·深度学习培训
Luke Ewin7 分钟前
基于FunASR开发的可私有化部署的语音转文字接口 | FunASR接口开发 | 语音识别接口私有化部署
人工智能·python·语音识别·fastapi·asr·funasr
龙山云仓9 分钟前
No095:沈括&AI:智能的科学研究与系统思维
开发语言·人工智能·python·机器学习·重构
LiYingL12 分钟前
多人对话视频生成的新发展:麻省理工学院数据集和基线模型 “CovOG
人工智能
ShiMetaPi12 分钟前
暴雪天气下的自动驾驶视觉困境:事件相机能否改善去雪效果?
图像处理·计算机视觉·自动驾驶·影像分析·事件相机·evs
超龄超能程序猿14 分钟前
YOLOv8中分类与目标检测模型训练的对比
yolo·目标检测·分类
人工智能培训14 分钟前
DNN案例一步步构建深层神经网络(二)
人工智能·神经网络·大模型·dnn·具身智能·智能体·大模型学习