召回率和精确率

召回率和精确率是一些文档中常用的词语,怎么理解了?本文会简单、明了的介绍一下!

概念

参考:en.wikipedia.org/wiki/Precis...

Precision (also called positive predictive value) is the fraction of relevant instances among the retrieved instances. Written as a formula:

Precision=Relevant retrieved instancesAll retrieved instances

Recall (also known as sensitivity) is the fraction of relevant instances that were retrieved. Written as a formula:

Recall=Relevant retrieved instancesAll relevant instances


例子

参考: www.zhihu.com/question/19...

公园里有50只皮卡丘和10只臭臭泥,有正常审美的人都会想要用精灵球把尽可能多的皮卡丘抓回来,同时尽可能少地抓住臭臭泥!最终我们的精灵球成功抓55只回来了,其中45只是皮卡丘和10是只臭臭泥!

我们就可以说50只皮卡丘中有45只被召唤 (call) 回来 (re) 了,所以 recall = 45 / 50,但同时,这台机器还误把5只臭臭泥识别为皮卡丘,在它抓回来的所有55只神奇宝贝中,精灵球对皮卡丘判断的精确率 (precision) = 45 / 55 !

  • TP = 45 (真正,抓对的)
  • FP = 55 - 45 = 10(假正,抓错了误报,例如我把10只臭臭泥当成了皮卡丘)
  • FN = 50 - 45 = 5(假负,将现实的True判断为Negative,没抓住漏报,例如这里我有5只皮卡丘没抓住)
  • TN = 10 - 10 = 0 (真负,全部的负集-误报,这里我们把错误的全抓了,所以这里为0)

recall(召回率) = TP/(TP+FN) = 45/50 抓回来多少,召回率越高需要降低精确率保证全都得抓住,可能抓错的就回多! precision(精确率) = TP/(TP+FP) = 45/55 抓对了多少,提高精确率需要保证你抓错的尽可能的少,可能抓回来的比较少!

实际应用

例如有一个监控报警的服务,通常来说对于一个流经LB的服务需要统计SLA,那么如果我们把报警的条件设计成5xx才报警的话,会造成漏报,导致一些对于4xx敏感的业务报警没报警出来,此时如果我们把条件变成4xx/5xx就会导致误报很多!

所以实际需求中需要根据业务实际情况来评估召回率/精确率,通常报警系统需要保证召回率尽可能的高需要保证90%以上,精确率只要保证20%左右就行了!

总结

避免漏报,就需要提高召回率,对应到代码里就是放宽条件限制!

避免误报,就需要提高精确率,对应到代码里就是多加一些条件判断!

综合来看需要一个权衡,不同业务场景要求的召回率和精确率是不一样的!

中文中有些不严谨,例如 精确率、准确率 这俩词其实一个意思,但是 precision、accuracy 是俩意思,注意很多文章拿精确率、准确率来做区分,本文所讲的主要是 precision!

相关推荐
小江的记录本7 小时前
【JVM虚拟机】垃圾回收GC:四种引用类型:强引用、软引用、弱引用、虚引用(附《思维导图》+《面试高频考点清单》)
java·jvm·spring boot·后端·python·spring·面试
小马爱打代码8 小时前
Spring源码 第四篇:Spring 5 源码深度拆解:AOP 全流程核心原理
java·后端·spring
ServBay8 小时前
2026 Mac 本地大模型部署深度解析与混合架构指南
后端·macos·aigc
一拳一个娘娘腔9 小时前
【SRC漏洞挖掘系列】第10期:GraphQL & API 安全 —— 现代 API 的“裸奔”时代
后端·安全·graphql
ZhengEnCi9 小时前
01-如何监听接口调用情况?
java·spring boot·后端
小马爱打代码11 小时前
Spring源码 第九篇:Spring 5 源码深度拆解 - Spring 事件驱动模型
java·后端·spring
ForgeAI码匠11 小时前
ForgeAdmin|Spring Boot 3 后台框架的自动配置设计:少写配置,多做组合
java·spring boot·后端
IT_陈寒12 小时前
为什么 Java 的 Optional 让我调试到深夜?
前端·人工智能·后端
用户83562907805112 小时前
用 Python 实现 Excel 散点图绘制与定制
后端·python
怪兽陪你看日出B12 小时前
一文彻底搞懂本地缓存之王-Caffeine
后端