AI大模型-评价指标-相关术语

shangjian0072025-11-24 2:31

背景

近期在学习AI大模型，对相关术语不甚了解，在此做个笔记。

术语

召回率

举例：核酸筛查时，100个人分别做核酸，其中10人实际有感染，结果找出10个感染者中的8人，又错找了3人。

此时，召回率= 8/10 = 80%

提高召回率的核心策略：宁可错抓，不可错放

准确率

又称精确率，和召回率紧密相关，上述例子中，测出11人阳性，其中3人测试结果有误。

此时，准确率= 8/11 ≈ 72.7%

提高准确率的核心策略：宁可错放，不可错抓

准确率和召回率的对比说明：

1、两者核心策略相反，往往需要根据具体场景权衡，难以兼得

2、需要明确，上述的难以兼得之结论，是以模型本身的智能水平不变为前提。实际场景中，人类当然需要两者兼得，其策略无非两种：

-- 1）将原模型更换为更高智能的模型

-- 2）将原模型组合使用，如A1负责高召回率，A2在A1的输出基础上负责高准确率，这样就能在原智能水平的基础上，同时提高准确率和召回率。这种组合本身，其本质也是创造了更高水平的智能，但潜力有限，并不能通过套娃再次提升智能水平