AI大模型-评价指标-相关术语

背景

近期在学习AI大模型,对相关术语不甚了解,在此做个笔记。

术语

召回率

举例:核酸筛查时,100个人分别做核酸,其中10人实际有感染,结果找出10个感染者中的8人,又错找了3人。

此时,召回率= 8/10 = 80%

提高召回率的核心策略:宁可错抓,不可错放

准确率

又称精确率,和召回率紧密相关,上述例子中,测出11人阳性,其中3人测试结果有误。

此时,准确率= 8/11 ≈ 72.7%

提高准确率的核心策略:宁可错放,不可错抓

准确率和召回率的对比说明:

1、两者核心策略相反,往往需要根据具体场景权衡,难以兼得

2、需要明确,上述的难以兼得之结论,是以模型本身的智能水平不变为前提。实际场景中,人类当然需要两者兼得,其策略无非两种:

-- 1)将原模型更换为更高智能的模型

-- 2)将原模型组合使用,如A1负责高召回率,A2在A1的输出基础上负责高准确率,这样就能在原智能水平的基础上,同时提高准确率和召回率。这种组合本身,其本质也是创造了更高水平的智能,但潜力有限,并不能通过套娃再次提升智能水平

相关推荐
_w_z_j_几秒前
全排列问题(包含重复数字与不可包含重复数字)
数据结构·算法·leetcode
7ioik1 分钟前
jvm垃圾回收算法?
jvm·算法
@小码农5 分钟前
LMCC大模型认证 青少年组 第一轮模拟样题
数据结构·人工智能·算法·蓝桥杯
知秋一叶1236 分钟前
Miloco 添加 RTSP 协议支持(非官方正式版)
人工智能·智能家居
测试人社区—小叶子9 分钟前
移动开发新宠:用Flutter 4.0快速构建跨平台应用
运维·网络·人工智能·测试工具·flutter·自动化
小小工匠14 分钟前
LLM - 从 Prompt 到上下文工程:面向 Java 的生产级 AI Agent 设计范式
人工智能·prompt·agent·上下文工程
dragoooon3416 分钟前
[hot100 NO.13~18]
算法
WangLanguager17 分钟前
Prototypical Networks 在图像识别中表现如何?
算法
我是你们的明哥19 分钟前
A*(A-Star)算法详解:智能路径规划的核心技术
后端·算法
秋刀鱼 ..21 分钟前
2026年光学、物理学与电子信息国际学术会议(OPEI 2026)
运维·人工智能·科技·金融·机器人