召回率和精确率

召回率和精确率是一些文档中常用的词语,怎么理解了?本文会简单、明了的介绍一下!

概念

参考:en.wikipedia.org/wiki/Precis...

Precision (also called positive predictive value) is the fraction of relevant instances among the retrieved instances. Written as a formula:

Precision=Relevant retrieved instancesAll retrieved instances

Recall (also known as sensitivity) is the fraction of relevant instances that were retrieved. Written as a formula:

Recall=Relevant retrieved instancesAll relevant instances


例子

参考: www.zhihu.com/question/19...

公园里有50只皮卡丘和10只臭臭泥,有正常审美的人都会想要用精灵球把尽可能多的皮卡丘抓回来,同时尽可能少地抓住臭臭泥!最终我们的精灵球成功抓55只回来了,其中45只是皮卡丘和10是只臭臭泥!

我们就可以说50只皮卡丘中有45只被召唤 (call) 回来 (re) 了,所以 recall = 45 / 50,但同时,这台机器还误把5只臭臭泥识别为皮卡丘,在它抓回来的所有55只神奇宝贝中,精灵球对皮卡丘判断的精确率 (precision) = 45 / 55 !

  • TP = 45 (真正,抓对的)
  • FP = 55 - 45 = 10(假正,抓错了[误报],例如我把10只臭臭泥当成了皮卡丘)
  • FN = 50 - 45 = 5(假负,将现实的True判断为Negative,没抓住[漏报],例如这里我有5只皮卡丘没抓住)
  • TN = 10 - 10 = 0 (真负,全部的负集-误报,这里我们把错误的全抓了,所以这里为0)

recall(召回率) = TP/(TP+FN) = 45/50 抓回来多少,召回率越高需要降低精确率保证全都得抓住,可能抓错的就回多! precision(精确率) = TP/(TP+FP) = 45/55 抓对了多少,提高精确率需要保证你抓错的尽可能的少,可能抓回来的比较少!

实际应用

例如有一个监控报警的服务,通常来说对于一个流经LB的服务需要统计SLA,那么如果我们把报警的条件设计成5xx才报警的话,会造成漏报,导致一些对于4xx敏感的业务报警没报警出来,此时如果我们把条件变成4xx/5xx就会导致误报很多!

所以实际需求中需要根据业务实际情况来评估召回率/精确率,通常报警系统需要保证召回率尽可能的高需要保证90%以上,精确率只要保证20%左右就行了!

总结

避免漏报,就需要提高召回率,对应到代码里就是放宽条件限制!

避免误报,就需要提高精确率,对应到代码里就是多加一些条件判断!

综合来看需要一个权衡,不同业务场景要求的召回率和精确率是不一样的!

中文中有些不严谨,例如 精确率、准确率 这俩词其实一个意思,但是 precision、accuracy 是俩意思,注意很多文章拿精确率、准确率来做区分,本文所讲的主要是 precision!

相关推荐
Hello.Reader2 小时前
深入浅出 Rust 的强大 match 表达式
开发语言·后端·rust
customer085 小时前
【开源免费】基于SpringBoot+Vue.JS体育馆管理系统(JAVA毕业设计)
java·vue.js·spring boot·后端·开源
计算机-秋大田8 小时前
基于微信小程序的电子竞技信息交流平台设计与实现(LW+源码+讲解)
spring boot·后端·微信小程序·小程序·课程设计
加油,旭杏10 小时前
【go语言】接口
开发语言·后端·golang
谢大旭10 小时前
ASP.NET Core 中间件
后端·中间件·c#
customer0811 小时前
【开源免费】基于SpringBoot+Vue.JS景区民宿预约系统(JAVA毕业设计)
java·vue.js·spring boot·后端·开源
uzong12 小时前
Java函数式接口:代码艺术的诗意绽放
后端
HelloDam13 小时前
基于 mzt-biz-log 实现接口调用日志记录
后端
SomeB1oody13 小时前
【Rust自学】15.6. RefCell与内部可变性:“摆脱”安全性限制
开发语言·后端·rust