目标检测常用评价指标

1 基本概念
1.1 IOU(Intersection over Union)
1.2 TP TN FP FN
2. 各种率
3. PR曲线
4. mAP的计算
4.1 AP的计算
4.2 mAP
4.3 mAP@0.5和mAP@0.5:0.95

1.1 IOU(Intersection over Union)

1.2 TP TN FP FN

TP(Truth Positive): 预测正类,实际正类,即预测正确

TN(Truth Negative):预测负类,实际负类,即预测正确

FP(False Positive): 预测正类,实际负类,即预测错误,和误检率有关

FN(False Negative):预测负类,实际正类,即预测错误,和漏检率有关

预测对(不管正负)即T,否则P;预测为正类即P(不管正确与否),否则负类N
2. Accuracy、Precision、Recall、F1 SCORE

Accuracy:准确率, ( T P + T N ) / ( P + N )(TP+TN)/(P+N),即正负样本正确数量/总样本。这个指标在样本比例差异较大时,容易失效,因为只要将全部预测成比例多的那种即可得到很高的准确率。

Precision:精确率,也可认为是查准率,预测的正类中对了几个T P / ( T P + F P )TP/(TP+FP),即正确预测正类/(正确预测正类+错误预测正类)=正确预测正类/所有预测正类样本,你猜的全部正类中,查得正确的正类的数量。误检率=1-Precision

Recall:召回率,也可认为是查全率,全部正类中你猜对了几个T P / ( T P + F N )TP/(TP+FN),即预测正确正类/(预测正确正类+预测错误负类)=预测正确正类/所有GT正类样本,理解成正类中召回了多少,查得多全。漏检率=1-Recall。

F1 SCORE:查全率和查准率的调和平均,1 / F 1 = 1 / 2 ∗ ( 1 / P + 1 / R )1/F_1 =1/2*(1/P+1/R),综合考虑两个指标,并且受小的影响比较大.
3. PR曲线

P和R是两个不同维度的衡量方法。有时这两个是矛盾的,比如只检测出了一个结果,且是正确的,那么P就是100%,但是R就会很低。如果我们把所有认为可能的结果都返回,那么P可能就会很低,R就很高

比如:

R高P低:所有汽车都被正确识别出来,但是很多卡车也被误认为是汽车

R低P高:识别出的飞机都是正确的,但还有很多飞机没被识别出来

PR曲线:就是选择不同的置信度阈值,得到的不同组合的P,R,以R为横坐标,P为纵坐标绘制而成。高度不均衡的数据集时,PR曲线能表现出更多的信息。

ROC曲线:就是选择不同的置信度阈值,以FPR=FP/(FP+FN),即错误预测正样本/所有预测负样本,为横坐标, TPR=TP/(TP+FN)=Recall为纵坐标。评估分类器的可信度

在ROC曲线中,以FPR为x轴,TPR为y轴,FPR指实际负样本中被错误预测为正样本的概率。TPR指实际正样本中被预测正确的概率。如下图:

![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/086779a1af6a408ebda4244305257abc.png![在这里插入图片描述](https://file.jishuzhan.net/article/1730056262130864129/3c08953642097d3a95354b3864084632.webp)

4. mAP的计算

4.1 AP (Average Precision),平均准确度

AP就是对PR曲线求积分

4.2 mAP

就是对不同类别的AP取平均。

4.3 mAP@0.5和mAP@0.5:0.95

mAP@0.5就是计算IOU=0.5的PR曲线与坐标轴所包围的面积

mAP@0.5:0.95就是在不同IoU(从0.5到0.95,步长0.05)(0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95)上的平均mAP。

〖AP〗small,〖AP〗medium,〖AP〗large对应area<〖32〗2, area<〖96〗^2, area>〖96〗^2目标大小

相关推荐
猫头虎12 分钟前
大模型训练中的关键技术与挑战:数据采集、微调与资源优化
人工智能·爬虫·数据挖掘·数据分析·网络爬虫·aigc·1024程序员节
yanxing.D44 分钟前
penCV轻松入门_面向python(第七章 图像平滑处理)
图像处理·人工智能·opencv·计算机视觉
骥龙1 小时前
1.1、开篇:AI如何重塑网络安全攻防格局?
人工智能·安全·web安全
微学AI1 小时前
国产数据库替代MongoDB的技术实践过程:金仓多模数据库在电子证照系统中的深度应用
数据库·人工智能·1024程序员节
gddkxc1 小时前
AI驱动的客户管理:悟空AI CRM的核心功能与优势
人工智能
狂奔solar2 小时前
Apple 开源FastVLM:AI看图说话更快更准
人工智能
星空的资源小屋2 小时前
Antares SQL,一款跨平台开源 SQL 客户端
数据库·人工智能·pdf·开源·电脑·excel·1024程序员节
集和诚JHCTECH2 小时前
赋能边缘智能:BRAV-7722搭载全新Edge BMC模块,开启远程运维新纪元!
人工智能·嵌入式硬件
WLJT1231231233 小时前
生活电器:重构家居体验的产业变革与发展探索
大数据·人工智能·科技·生活