目标检测常用评价指标

1 基本概念
1.1 IOU(Intersection over Union)
1.2 TP TN FP FN
2. 各种率
3. PR曲线
4. mAP的计算
4.1 AP的计算
4.2 mAP
4.3 mAP@0.5和mAP@0.5:0.95

1.1 IOU(Intersection over Union)

1.2 TP TN FP FN

TP(Truth Positive): 预测正类,实际正类,即预测正确

TN(Truth Negative):预测负类,实际负类,即预测正确

FP(False Positive): 预测正类,实际负类,即预测错误,和误检率有关

FN(False Negative):预测负类,实际正类,即预测错误,和漏检率有关

预测对(不管正负)即T,否则P;预测为正类即P(不管正确与否),否则负类N
2. Accuracy、Precision、Recall、F1 SCORE

Accuracy:准确率, ( T P + T N ) / ( P + N )(TP+TN)/(P+N),即正负样本正确数量/总样本。这个指标在样本比例差异较大时,容易失效,因为只要将全部预测成比例多的那种即可得到很高的准确率。

Precision:精确率,也可认为是查准率,预测的正类中对了几个T P / ( T P + F P )TP/(TP+FP),即正确预测正类/(正确预测正类+错误预测正类)=正确预测正类/所有预测正类样本,你猜的全部正类中,查得正确的正类的数量。误检率=1-Precision

Recall:召回率,也可认为是查全率,全部正类中你猜对了几个T P / ( T P + F N )TP/(TP+FN),即预测正确正类/(预测正确正类+预测错误负类)=预测正确正类/所有GT正类样本,理解成正类中召回了多少,查得多全。漏检率=1-Recall。

F1 SCORE:查全率和查准率的调和平均,1 / F 1 = 1 / 2 ∗ ( 1 / P + 1 / R )1/F_1 =1/2*(1/P+1/R),综合考虑两个指标,并且受小的影响比较大.
3. PR曲线

P和R是两个不同维度的衡量方法。有时这两个是矛盾的,比如只检测出了一个结果,且是正确的,那么P就是100%,但是R就会很低。如果我们把所有认为可能的结果都返回,那么P可能就会很低,R就很高

比如:

R高P低:所有汽车都被正确识别出来,但是很多卡车也被误认为是汽车

R低P高:识别出的飞机都是正确的,但还有很多飞机没被识别出来

PR曲线:就是选择不同的置信度阈值,得到的不同组合的P,R,以R为横坐标,P为纵坐标绘制而成。高度不均衡的数据集时,PR曲线能表现出更多的信息。

ROC曲线:就是选择不同的置信度阈值,以FPR=FP/(FP+FN),即错误预测正样本/所有预测负样本,为横坐标, TPR=TP/(TP+FN)=Recall为纵坐标。评估分类器的可信度

在ROC曲线中,以FPR为x轴,TPR为y轴,FPR指实际负样本中被错误预测为正样本的概率。TPR指实际正样本中被预测正确的概率。如下图:

!在这里插入图片描述(https://img-blog.csdnimg.cn/direct/086779a1af6a408ebda4244305257abc.png![在这里插入图片描述](https://file.jishuzhan.net/article/1730056262130864129/3c08953642097d3a95354b3864084632.webp)

4. mAP的计算

4.1 AP (Average Precision),平均准确度

AP就是对PR曲线求积分

4.2 mAP

就是对不同类别的AP取平均。

4.3 mAP@0.5和mAP@0.5:0.95

mAP@0.5就是计算IOU=0.5的PR曲线与坐标轴所包围的面积

mAP@0.5:0.95就是在不同IoU(从0.5到0.95,步长0.05)(0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95)上的平均mAP。

〖AP〗small,〖AP〗medium,〖AP〗large对应area<〖32〗2, area<〖96〗^2, area>〖96〗^2目标大小

相关推荐
zhangfeng113317 分钟前
台大李宏毅老师讲解memba和类似linear atttenion 模型,笔记
开发语言·人工智能·笔记
xiaozhazha_1 小时前
【技术架构】2026企业级AI落地实践:从RPA到AI Agent的原生CRM重构!
人工智能·架构·rpa
火山引擎开发者社区8 小时前
技术速递|使用 GitHub Copilot CLI 构建 Emoji 列表生成器
人工智能
codefan※8 小时前
干掉“幻觉“实战:如何构建企业级知识图谱增强 RAG
人工智能·知识图谱
wukangjupingbb8 小时前
传统基于药物 SMILES 序列和蛋白质氨基酸序列的 DTI(Drug-Target Interaction)预测方法的缺陷
人工智能
沪漂阿龙8 小时前
Codex 额度重置周期变化:AI 编程免费试玩时代正在结束
人工智能
TickDB9 小时前
美股行情 API 接入避坑:REST 快照、WebSocket 推送、盘前盘后数据的边界
人工智能·python·websocket·行情数据 api
装不满的克莱因瓶9 小时前
深入理解卷积神经网络(CNN)——从原理到代码实践
人工智能·神经网络·cnn
完成大叔9 小时前
模块二,Agent知识图谱的工具链思考
人工智能
lauo9 小时前
ibbot手机发布:搭载poplang技术 + token节点经济,革新AI手机体验
人工智能·智能手机