AI大模型-评价指标-相关术语

背景

近期在学习AI大模型,对相关术语不甚了解,在此做个笔记。

术语

召回率

举例:核酸筛查时,100个人分别做核酸,其中10人实际有感染,结果找出10个感染者中的8人,又错找了3人。

此时,召回率= 8/10 = 80%

提高召回率的核心策略:宁可错抓,不可错放

准确率

又称精确率,和召回率紧密相关,上述例子中,测出11人阳性,其中3人测试结果有误。

此时,准确率= 8/11 ≈ 72.7%

提高准确率的核心策略:宁可错放,不可错抓

准确率和召回率的对比说明:

1、两者核心策略相反,往往需要根据具体场景权衡,难以兼得

2、需要明确,上述的难以兼得之结论,是以模型本身的智能水平不变为前提。实际场景中,人类当然需要两者兼得,其策略无非两种:

-- 1)将原模型更换为更高智能的模型

-- 2)将原模型组合使用,如A1负责高召回率,A2在A1的输出基础上负责高准确率,这样就能在原智能水平的基础上,同时提高准确率和召回率。这种组合本身,其本质也是创造了更高水平的智能,但潜力有限,并不能通过套娃再次提升智能水平

相关推荐
行走的小派1 小时前
引爆AI智能体时代!OPi 6Plus全面适配OpenClaw
人工智能
云边有个稻草人1 小时前
CANN:解构AIGC底层算力,ops-nn驱动神经网络算子加速
人工智能·神经网络·aigc·cann
爱吃大芒果1 小时前
CANN神经网络算子库设计思路:ops-nn项目的工程化实现逻辑
人工智能·深度学习·神经网络
weixin_499771551 小时前
C++中的组合模式
开发语言·c++·算法
人工智能培训2 小时前
具身智能如何让智能体理解物理定律?
人工智能·多模态学习·具身智能·ai培训·人工智能工程师·物理定律
lili-felicity2 小时前
CANN加速Stable Diffusion文生图推理:从UNet优化到内存复用
人工智能·aigc
哈__2 小时前
CANN加速语音合成TTS推理:声学模型与声码器优化
人工智能
哈__2 小时前
CANN加速VAE变分自编码器推理:潜在空间重构与编码解码优化
人工智能·深度学习·重构
美狐美颜SDK开放平台2 小时前
多终端适配下的人脸美型方案:美颜SDK工程开发实践分享
人工智能·音视频·美颜sdk·直播美颜sdk·视频美颜sdk
哈__2 小时前
CANN加速Image Captioning图像描述生成:视觉特征提取与文本生成优化
人工智能