大模型的召回率

召回率

什么是召回率:大模型在回答问题时,需要从知识库中提取相关信息进行分析,从超大数据量的知识库中提取有效的能力就叫召回率,召回率越高说明提取有效信息的能力越强,否则越弱。

为什么会有召回率:因为知识库的数据量及其庞大,且大模型的信息处理能力非常有限,单次仅能处理几万十几万字符的数据量,所以必须找到与查询问题关联度最高的信息来输入给大模型进行处理,否则就无法有效利用知识库信息。

优点是什么:优点是可以大幅降低注入大模型的信息量从而降级计算成本,提高处理效率。

缺点是什么:缺点是由于召回的信息量有限制,注入大模型的信息不足,信息完整度不足,从而导致输出的分析不全面、不完整,从而得出错误结论。

如何解决召回缺点带来的问题:首先是增加召回数量上限,比如dify中的召回片段数topK最大只有10,也就是最多只能召回10个片段的切片信息注入到大模型中进行处理,很明显大量的场景需要注入的信息量都远远大于这个上限,缺点是计算成本会上升。其次是保证召回信息的准确度,确保召回的信息是与查询的问题高度关联的信息,而不会将关联度低的信息注入大模型形成噪音,从而导致分析结果偏离实际预期。

相关推荐
33三 三like22 分钟前
《基于知识图谱和智能推荐的养老志愿服务系统》开发日志
人工智能·知识图谱
芝士爱知识a24 分钟前
【工具推荐】2026公考App横向评测:粉笔、华图与智蛙面试App功能对比
人工智能·软件推荐·ai教育·结构化面试·公考app·智蛙面试app·公考上岸
腾讯云开发者1 小时前
港科大熊辉|AI时代的职场新坐标——为什么你应该去“数据稀疏“的地方?
人工智能
工程师老罗2 小时前
YoloV1数据集格式转换,VOC XML→YOLOv1张量
xml·人工智能·yolo
Coder_Boy_2 小时前
技术让开发更轻松的底层矛盾
java·大数据·数据库·人工智能·深度学习
啊森要自信2 小时前
CANN ops-cv:面向计算机视觉的 AI 硬件端高效算子库核心架构与开发逻辑
人工智能·计算机视觉·架构·cann
2401_836235862 小时前
中安未来SDK15:以AI之眼,解锁企业档案的数字化基因
人工智能·科技·深度学习·ocr·生活
njsgcs2 小时前
llm使用 AgentScope-Tuner 通过 RL 训练 FrozenLake 智能体
人工智能·深度学习
董董灿是个攻城狮2 小时前
AI 视觉连载2:灰度图
人工智能