召回率和精确率

召回率和精确率是一些文档中常用的词语,怎么理解了?本文会简单、明了的介绍一下!

概念

参考:en.wikipedia.org/wiki/Precis...

Precision (also called positive predictive value) is the fraction of relevant instances among the retrieved instances. Written as a formula:

Precision=Relevant retrieved instancesAll retrieved instances

Recall (also known as sensitivity) is the fraction of relevant instances that were retrieved. Written as a formula:

Recall=Relevant retrieved instancesAll relevant instances


例子

参考: www.zhihu.com/question/19...

公园里有50只皮卡丘和10只臭臭泥,有正常审美的人都会想要用精灵球把尽可能多的皮卡丘抓回来,同时尽可能少地抓住臭臭泥!最终我们的精灵球成功抓55只回来了,其中45只是皮卡丘和10是只臭臭泥!

我们就可以说50只皮卡丘中有45只被召唤 (call) 回来 (re) 了,所以 recall = 45 / 50,但同时,这台机器还误把5只臭臭泥识别为皮卡丘,在它抓回来的所有55只神奇宝贝中,精灵球对皮卡丘判断的精确率 (precision) = 45 / 55 !

  • TP = 45 (真正,抓对的)
  • FP = 55 - 45 = 10(假正,抓错了[误报],例如我把10只臭臭泥当成了皮卡丘)
  • FN = 50 - 45 = 5(假负,将现实的True判断为Negative,没抓住[漏报],例如这里我有5只皮卡丘没抓住)
  • TN = 10 - 10 = 0 (真负,全部的负集-误报,这里我们把错误的全抓了,所以这里为0)

recall(召回率) = TP/(TP+FN) = 45/50 抓回来多少,召回率越高需要降低精确率保证全都得抓住,可能抓错的就回多! precision(精确率) = TP/(TP+FP) = 45/55 抓对了多少,提高精确率需要保证你抓错的尽可能的少,可能抓回来的比较少!

实际应用

例如有一个监控报警的服务,通常来说对于一个流经LB的服务需要统计SLA,那么如果我们把报警的条件设计成5xx才报警的话,会造成漏报,导致一些对于4xx敏感的业务报警没报警出来,此时如果我们把条件变成4xx/5xx就会导致误报很多!

所以实际需求中需要根据业务实际情况来评估召回率/精确率,通常报警系统需要保证召回率尽可能的高需要保证90%以上,精确率只要保证20%左右就行了!

总结

避免漏报,就需要提高召回率,对应到代码里就是放宽条件限制!

避免误报,就需要提高精确率,对应到代码里就是多加一些条件判断!

综合来看需要一个权衡,不同业务场景要求的召回率和精确率是不一样的!

中文中有些不严谨,例如 精确率、准确率 这俩词其实一个意思,但是 precision、accuracy 是俩意思,注意很多文章拿精确率、准确率来做区分,本文所讲的主要是 precision!

相关推荐
姑苏洛言9 分钟前
《全民国家安全教育知识竞赛》小程序开发全记录
前端·后端
掘了10 分钟前
分布式系统中如何保证崩溃一致性?
分布式·后端·面试
eternal__day31 分钟前
Spring Boot 快速入手
java·spring boot·后端·spring·java-ee·maven
爱的叹息43 分钟前
Spring Boot中事务状态(TransactionStatus)的核心信息及常见应用场景
java·spring boot·后端
安然无虞1 小时前
31天Python入门——第20天:魔法方法详解
开发语言·后端·爬虫·python
锋行天下1 小时前
WebSocket 即时通讯前后端设计和基于token的鉴权
前端·后端
猿java2 小时前
程序员,你使用过灰度发布吗?
java·分布式·后端
iOS开发上架哦2 小时前
Flutter,让我们把 Navigator与Route详解 再讲一遍
后端
半桔2 小时前
红黑树剖析
c语言·开发语言·数据结构·c++·后端·算法
疯狂的程序猴2 小时前
flutter - 图文讲解表单组件基本使用 & 注册实战
后端