召回率和精确率

召回率和精确率是一些文档中常用的词语,怎么理解了?本文会简单、明了的介绍一下!

概念

参考:en.wikipedia.org/wiki/Precis...

Precision (also called positive predictive value) is the fraction of relevant instances among the retrieved instances. Written as a formula:

Precision=Relevant retrieved instancesAll retrieved instances

Recall (also known as sensitivity) is the fraction of relevant instances that were retrieved. Written as a formula:

Recall=Relevant retrieved instancesAll relevant instances


例子

参考: www.zhihu.com/question/19...

公园里有50只皮卡丘和10只臭臭泥,有正常审美的人都会想要用精灵球把尽可能多的皮卡丘抓回来,同时尽可能少地抓住臭臭泥!最终我们的精灵球成功抓55只回来了,其中45只是皮卡丘和10是只臭臭泥!

我们就可以说50只皮卡丘中有45只被召唤 (call) 回来 (re) 了,所以 recall = 45 / 50,但同时,这台机器还误把5只臭臭泥识别为皮卡丘,在它抓回来的所有55只神奇宝贝中,精灵球对皮卡丘判断的精确率 (precision) = 45 / 55 !

  • TP = 45 (真正,抓对的)
  • FP = 55 - 45 = 10(假正,抓错了[误报],例如我把10只臭臭泥当成了皮卡丘)
  • FN = 50 - 45 = 5(假负,将现实的True判断为Negative,没抓住[漏报],例如这里我有5只皮卡丘没抓住)
  • TN = 10 - 10 = 0 (真负,全部的负集-误报,这里我们把错误的全抓了,所以这里为0)

recall(召回率) = TP/(TP+FN) = 45/50 抓回来多少,召回率越高需要降低精确率保证全都得抓住,可能抓错的就回多! precision(精确率) = TP/(TP+FP) = 45/55 抓对了多少,提高精确率需要保证你抓错的尽可能的少,可能抓回来的比较少!

实际应用

例如有一个监控报警的服务,通常来说对于一个流经LB的服务需要统计SLA,那么如果我们把报警的条件设计成5xx才报警的话,会造成漏报,导致一些对于4xx敏感的业务报警没报警出来,此时如果我们把条件变成4xx/5xx就会导致误报很多!

所以实际需求中需要根据业务实际情况来评估召回率/精确率,通常报警系统需要保证召回率尽可能的高需要保证90%以上,精确率只要保证20%左右就行了!

总结

避免漏报,就需要提高召回率,对应到代码里就是放宽条件限制!

避免误报,就需要提高精确率,对应到代码里就是多加一些条件判断!

综合来看需要一个权衡,不同业务场景要求的召回率和精确率是不一样的!

中文中有些不严谨,例如 精确率、准确率 这俩词其实一个意思,但是 precision、accuracy 是俩意思,注意很多文章拿精确率、准确率来做区分,本文所讲的主要是 precision!

相关推荐
顽石九变5 分钟前
【SpringBoo3】SpringBoot项目Web拦截器使用
spring boot·后端
梦兮林夕22 分钟前
从零掌握 Gin 参数解析与验证
后端·go·gin
bobz96532 分钟前
IPSec IKE PSK 与扩展支持Xauth账户密码
后端
supermodule33 分钟前
基于flask的一个数据展示网页
后端·python·flask
315356691341 分钟前
manus邀请码申请手把手教程
前端·后端·面试
青石路1 小时前
经由同个文件多次压缩的文件MD5都不一样问题排查,感慨AI的强大!
java·后端
RainbowSea1 小时前
5. MySQL 存储引擎(详解说明)
数据库·后端·mysql
RainbowSea1 小时前
130道基础OJ编程题之: 68\~77
java·后端
庄园特聘拆椅狂魔3 小时前
SpringBoot项目中注解使用规范
java·spring boot·后端
架构文摘JGWZ3 小时前
Spring40种注解(下)!!
后端·学习·spring