AI大模型-评价指标-相关术语

背景

近期在学习AI大模型,对相关术语不甚了解,在此做个笔记。

术语

召回率

举例:核酸筛查时,100个人分别做核酸,其中10人实际有感染,结果找出10个感染者中的8人,又错找了3人。

此时,召回率= 8/10 = 80%

提高召回率的核心策略:宁可错抓,不可错放

准确率

又称精确率,和召回率紧密相关,上述例子中,测出11人阳性,其中3人测试结果有误。

此时,准确率= 8/11 ≈ 72.7%

提高准确率的核心策略:宁可错放,不可错抓

准确率和召回率的对比说明:

1、两者核心策略相反,往往需要根据具体场景权衡,难以兼得

2、需要明确,上述的难以兼得之结论,是以模型本身的智能水平不变为前提。实际场景中,人类当然需要两者兼得,其策略无非两种:

-- 1)将原模型更换为更高智能的模型

-- 2)将原模型组合使用,如A1负责高召回率,A2在A1的输出基础上负责高准确率,这样就能在原智能水平的基础上,同时提高准确率和召回率。这种组合本身,其本质也是创造了更高水平的智能,但潜力有限,并不能通过套娃再次提升智能水平

相关推荐
大刚测试开发实战4 小时前
TestHub V0.2.2版本发布,附更新指南
人工智能
冬奇Lab5 小时前
Agent 系列(21):Harness 测试工程——45 个测试怎么设计,以及它发现了什么 bug
人工智能·llm·agent
冬奇Lab6 小时前
每日一个开源项目(第133篇):EchoBird - 把 AI 工具的安装和部署做成傻瓜操作
人工智能·开源·资讯
IT_陈寒7 小时前
Redis的SETNX并发问题让我加了三天班
前端·人工智能·后端
用户5191495848459 小时前
Windows 渗透测试载荷加载器 POC 工具集
人工智能·aigc
大树889 小时前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
通信小呆呆9 小时前
当算法有了“五感”:多模态数据融合如何向人体感官协同学习?
人工智能·学习·算法·机器学习·机器人
施小赞9 小时前
普通 RAG vs GraphRAG 核心对比
人工智能·ai
EAIReport9 小时前
RuoYi-AI 企业级AI开发平台实战详解
人工智能
HelloWorld__来都来了9 小时前
【每日学术速报】2026-06-15
人工智能·具身智能