目标检测中的mAP计算原理和源码实现

简介

在目标检测任务中,mAP(mean Average Precision,平均精度均值)是一个非常重要的评价指标,用于衡量模型在多个类别上的平均性能。它综合考虑了模型在不同召回率下的精确率,能够全面反映模型在检测任务中的表现。
作用

综合性评估:mAP能够综合考虑模型在不同召回率下的精确率,避免了单一指标(如准确率或召回率)可能带来的片面性。

多类别比较:对于多类别的目标检测任务,mAP可以计算每个类别的AP,然后取平均值得到全局的mAP,从而方便比较模型在不同类别上的性能。

模型选择和调优:通过比较不同模型或不同参数设置下的mAP值,可以选择性能更优的模型或确定最佳的参数配置。
计算方法

计算每个类别的AP:

对于每个类别,首先根据模型输出的预测框和真实的标注框计算交并比(IOU)。

根据设定的IOU阈值(通常为0.5),将预测框分为真正例(TP)、假正例(FP)和假反例(FN)。

对于每个预测框,根据当前的TP和FP数量计算精确率(Precision)和召回率(Recall)。

绘制该类别的PR曲线,即Precision随Recall变化的曲线。

计算PR曲线下方的面积,得到该类别的AP值。这通常可以通过插值法实现,如11点插值法,即在Recall坐标轴上选择11个点(如0, 0.1, 0.2, ..., 1),然后计算这些点对应的Precision的平均值作为AP的近似值。

计算全局的mAP:

对于所有类别,分别计算得到各自的AP值。

将所有类别的AP值取平均值,得到全局的mAP值。

需要注意的是,mAP的计算过程可能因使用的数据集和评估标准而有所不同。例如,COCO数据集和PASCAL VOC数据集在计算mAP时可能采用不同的IOU阈值或插值方法。因此,在实际应用中,需要根据具体的数据集和评估要求来确定mAP的计算方法。

实现过程

假定我的输入为3D的目标检测的pred_boxes和gt_boxes

image_idx cls_id x y z l w h yaw score(for pred_boxes)

pred_boxes = py.array([[0, 1, 13, 13, 0, 6, 6, 2, 0, 0.9],

0, 0, 35, 30, 0, 10, 8, 2, 0, 0.9\], \[1, 0, 12, 30, 0, 6, 9, 2, 0, 0.5\]\]) gt_boxes = py.array(\[\[0, 1, 10, 10, 0, 6, 6, 2, 0\], \[0, 0, 30, 30, 0, 10, 8, 2, 0\], \[0, 0, 10, 30, 0, 6, 9, 2, 0\]\])

可视化一下image_idx=0的boxes:

在每个类别中提取每个样本的这个类别的pred_boxes和gt_boxes,并计算iou值,根据iou阈值划分tp(正确检测)和fp(误检).

cpp 复制代码
over_laps = iou(pred_boxes=pred_boxes_cls_img[:, [2, 3, 5, 6]],
                                    gt_boxes=gt_boxes_cls_img[:, [2, 3, 5, 6]])
corr_gts = np.argmax(over_laps, axis=1)
corr_iou = np.max(over_laps, axis=1)
visited_gt = []
for id, pred_box in enumerate(pred_boxes_cls_img):
    if corr_iou[id] >= iou_threshold and corr_gts[id] not in visited_gt:
         visited_gt.append(corr_gts[id])  # if pred got gt, the gt should be ignore
         fp_or_tp.append(1)
    else:
         fp_or_tp.append(0)

统计所有样本的pred_boxes的tp/fp类型及其score,安照score降序排序.

cpp 复制代码
scores = pred_boxes_cls[:, -1]
index = np.argsort(-scores, )
# sort fp_or_tp by decending order of scores
fp_or_tp = fp_or_tp[index]

根据score列表依次选择有效的pred_boxes,计算precision=tp/(tp+fp)和recall=tp/gt_boxes.size().

precision和recall列表形成pr曲线,计算pr曲线面积即可.

cpp 复制代码
# 根据>=score的是有效pred,有效pred中,0是f,1是检测到了目标, 1的数量除以总的有效pred就precious
# 1的数量除以真值数量就是recall
tp_num_list = np.cumsum(fp_or_tp)
pred_num_list = np.cumsum(np.ones_like(fp_or_tp))
precision_array = tp_num_list / pred_num_list
recall_array = tp_num_list / tp_and_tn
ap = compute_ap(recall_array, precision_array, class_name)

注意求pr曲线面积时,横坐标(长)要是recall,而不能是用score求平均precision.

思考下 :

pr曲线会不会出现左低右高的情况?是有的,当fp的score较高时候就会出现这个问题.比如score最高的第一个就是fp.那么这时recall很小时,precision为0.

解决方法:recall_list和precision_list的首尾补上(0,1)或者(1,0),然后单调性处理

再分析下:score降序,recall肯定是递增的,但是precision不一定是递减,因此需要使得它单调,具体操作:

cpp 复制代码
    for i in range(len(precision_array)-1, 0,-1):
        precision_array[i-1] = np.max(precision_array[i-1], precision_array[i])

参考:b站视频

相关推荐
好家伙VCC4 分钟前
**神经编码新视角:用Python实现生物启发的神经信号压缩与解码算法**在人工智能飞速发展的今天
java·人工智能·python·算法
Navicat中国4 分钟前
如何使用 Ollama 配置 AI 助手 | Navicat 教程
数据库·人工智能·ai·navicat·ollama
@小匠4 小时前
Read Frog:一款开源的 AI 驱动浏览器语言学习扩展
人工智能·学习
网教盟人才服务平台7 小时前
“方班预备班盾立方人才培养计划”正式启动!
大数据·人工智能
芯智工坊7 小时前
第15章 Mosquitto生产环境部署实践
人工智能·mqtt·开源
菜菜艾7 小时前
基于llama.cpp部署私有大模型
linux·运维·服务器·人工智能·ai·云计算·ai编程
TDengine (老段)8 小时前
TDengine IDMP 可视化 —— 分享
大数据·数据库·人工智能·时序数据库·tdengine·涛思数据·时序数据
小真zzz8 小时前
搜极星:第三方多平台中立GEO洞察专家全面解析
人工智能·搜索引擎·seo·geo·中立·第三方平台
GreenTea8 小时前
从 Claw-Code 看 AI 驱动的大型项目开发:2 人 + 10 个自治 Agent 如何产出 48K 行 Rust 代码
前端·人工智能·后端
火山引擎开发者社区9 小时前
秒级创建实例,火山引擎 Milvus Serverless 让 AI Agent 开发更快更省
人工智能