大模型的召回率

召回率

什么是召回率:大模型在回答问题时,需要从知识库中提取相关信息进行分析,从超大数据量的知识库中提取有效的能力就叫召回率,召回率越高说明提取有效信息的能力越强,否则越弱。

为什么会有召回率:因为知识库的数据量及其庞大,且大模型的信息处理能力非常有限,单次仅能处理几万十几万字符的数据量,所以必须找到与查询问题关联度最高的信息来输入给大模型进行处理,否则就无法有效利用知识库信息。

优点是什么:优点是可以大幅降低注入大模型的信息量从而降级计算成本,提高处理效率。

缺点是什么:缺点是由于召回的信息量有限制,注入大模型的信息不足,信息完整度不足,从而导致输出的分析不全面、不完整,从而得出错误结论。

如何解决召回缺点带来的问题:首先是增加召回数量上限,比如dify中的召回片段数topK最大只有10,也就是最多只能召回10个片段的切片信息注入到大模型中进行处理,很明显大量的场景需要注入的信息量都远远大于这个上限,缺点是计算成本会上升。其次是保证召回信息的准确度,确保召回的信息是与查询的问题高度关联的信息,而不会将关联度低的信息注入大模型形成噪音,从而导致分析结果偏离实际预期。

相关推荐
挖坑的张师傅26 分钟前
方便 Mac 本机运行 e2b 的沙箱方案 e2b-local
人工智能·后端
生成论实验室32 分钟前
认知芯片:让判断力在物理定律上运行——AI芯片的第三条路
人工智能·语言模型·机器人·自动驾驶·安全架构
浦信仿真大讲堂32 分钟前
达索系统SIMULIA Abaqus 2026接触和约束的增强新功能介绍
人工智能·python·算法·仿真软件·达索软件
文艺倾年38 分钟前
【强化学习】MDP、贝尔曼方程与CartPole 编程,20W字总结(二)
人工智能·软件工程·强化学习
ttt606_44 分钟前
门店业绩上报系统功能拆解:门店业绩上报如何提高数据精确度与时效性?
大数据·人工智能
phltxy1 小时前
Spring AI 可观测性与 Zipkin 实战
java·人工智能·spring
ACP广源盛139246256731 小时前
GSV2221@ACP#DP 1.4 MST 多屏转换芯片,物理 AI 多模态交互的视觉中枢
大数据·人工智能·嵌入式硬件·gpt·spark
HIT_Weston1 小时前
117、【Agent】【OpenCode】项目配置(根目录&子包配置)
人工智能·agent·opencode
多年小白1 小时前
【周末消息汇总】2026年6月12日-14日——放量突破,明日开盘策略
人工智能·ai
RSTJ_16251 小时前
PYTHON+AI LLM DAY SEVENTY-SIX
人工智能