大模型的召回率

召回率

什么是召回率:大模型在回答问题时,需要从知识库中提取相关信息进行分析,从超大数据量的知识库中提取有效的能力就叫召回率,召回率越高说明提取有效信息的能力越强,否则越弱。

为什么会有召回率:因为知识库的数据量及其庞大,且大模型的信息处理能力非常有限,单次仅能处理几万十几万字符的数据量,所以必须找到与查询问题关联度最高的信息来输入给大模型进行处理,否则就无法有效利用知识库信息。

优点是什么:优点是可以大幅降低注入大模型的信息量从而降级计算成本,提高处理效率。

缺点是什么:缺点是由于召回的信息量有限制,注入大模型的信息不足,信息完整度不足,从而导致输出的分析不全面、不完整,从而得出错误结论。

如何解决召回缺点带来的问题:首先是增加召回数量上限,比如dify中的召回片段数topK最大只有10,也就是最多只能召回10个片段的切片信息注入到大模型中进行处理,很明显大量的场景需要注入的信息量都远远大于这个上限,缺点是计算成本会上升。其次是保证召回信息的准确度,确保召回的信息是与查询的问题高度关联的信息,而不会将关联度低的信息注入大模型形成噪音,从而导致分析结果偏离实际预期。

相关推荐
财迅通Ai1 小时前
商业航天概念领涨A股,航天ETF华安(159267.SZ)收盘上涨1.2%
大数据·人工智能·区块链·中国卫星·航天电子
齐齐大魔王1 小时前
智能语音技术(八)
人工智能·语音识别
许彰午1 小时前
零成本搭建RAG智能客服:Ollama + Milvus + DeepSeek全程实战
人工智能·语音识别·llama·milvus
ZPC82101 小时前
自定义action server 接收arm_controller 指令
人工智能·机器人
迷茫的启明星2 小时前
各职业在当前发展阶段,使用AI的舒适区与盲区
大数据·人工智能·职场和发展
Liqiuyue2 小时前
Transformer:现代AI革命背后的核心模型
人工智能·算法·机器学习
桂花饼3 小时前
AI 视频生成:sora-2 模型快速对接指南
人工智能·音视频·sora2·nano banana 2·claude-opus-4-6·gemini 3.1
GreenTea3 小时前
AI Agent 评测的下半场:从方法论到落地实践
前端·人工智能·后端
冬奇Lab4 小时前
一天一个开源项目(第73篇):Multica - 把 AI 编程智能体变成真正的团队成员
人工智能·开源·资讯