什么是召回(Recall)

在 RAG、检索系统、搜索引擎这类场景中,召回(Recall) 是指从全量数据中找出所有与用户问题 "可能相关" 的候选结果的过程 ,它是检索流程的第一步 ,核心目标是 "不漏掉任何潜在相关的内容"

你可以把检索流程拆成两步:

  1. 召回 :大海捞针,把所有沾边的内容都捞出来(追求);
  2. 排序 :去粗取精,把捞出来的内容按相关性高低排好序(追求)。

一、召回的核心特点

  1. 目标是 "高召回率",而非 "高精度" 召回阶段不纠结 "这条内容到底有多相关",只判断 "是否可能相关",所以会返回一个数量较多的候选集。比如用户问 "Spark 宽依赖",召回阶段会把所有包含 "Spark""宽依赖""窄依赖""依赖关系" 的文档片段都找出来,哪怕有些片段只是提了一句 "宽依赖是 Spark 中的概念",也会被纳入候选集。

  2. 速度优先,算法简单 召回要处理全量数据(比如百万级向量),所以必须用高效的算法,常见的召回策略有:

    • 向量召回:基于向量相似度的近似检索(如 Milvus 的 HNSW、IVF 算法),这是 RAG 中最常用的方式;
    • 关键词召回:基于关键词匹配(如 Elasticsearch 的倒排索引);
    • 混合召回:向量 + 关键词结合,兼顾语义和字面匹配。

二、召回率(Recall Rate):衡量召回效果的核心指标

召回率是一个量化指标,公式很简单:

召回率=全量数据中的相关结果总数检索到的相关结果数​×100%

  • 理想情况:召回率 = 100% → 所有相关内容都被找出来了,没有遗漏;
  • 实际情况:召回率不可能 100%(比如数据有噪声、算法有局限),我们需要在 "召回率" 和 "效率" 之间做平衡。

举个例子:全量数据里有 10 条和 "Spark 宽依赖" 相关的文档片段,召回阶段找出了 8 条 → 召回率 = 8/10 = 80%。

三、召回与之前提到的 "粗排、精排" 的关系

你可以把整个检索流程串起来,理解三者的分工:

复制代码
用户提问 → 问题处理(向量化/关键词提取) → 召回(从全量数据捞候选集,比如 200 条) → 粗排(快速过滤,缩到 50 条) → 精排(精准排序,选 Top-5) → 传给大模型
阶段 核心任务 目标 数据量变化
召回 从全量数据捞潜在相关内容 不漏掉相关结果 全量 → 几百条候选集
粗排 对候选集快速筛选 初步去噪 几百条 → 几十条
精排 对筛选后的数据精准排序 选出最相关结果 几十条 → 几条最终结果

四、RAG 中召回的实操关键点

  1. 召回数量(Top-N)的设置

    • 召回数量不能太少(比如只召回 10 条):容易漏掉相关内容,降低召回率;
    • 召回数量不能太多(比如召回 1000 条):会增加后续粗排、精排的计算量,拖慢整体速度;
    • 经验值:海量数据场景下,召回数量设为 最终需要结果数的 20~50 倍(比如最终要 5 条,召回 100~250 条)。
  2. 召回策略的选择

    • 语义相关为主:用向量召回(比如 Milvus 的 HNSW 索引);
    • 字面关键词相关为主:用关键词召回(比如 Elasticsearch);
    • 兼顾语义和字面:用混合召回(比如 Milvus + Elasticsearch 联动)。

五、举个代码例子(Milvus 中的召回操作)

复制代码
from pymilvus import Collection
from langchain_openai import OpenAIEmbeddings

# 1. 加载 Milvus 集合(表)
collection = Collection("tech_docs")
collection.load()

# 2. 问题向量化
embeddings = OpenAIEmbeddings()
query_vector = embeddings.embed_query("Spark 宽依赖和窄依赖的区别")

# 3. 召回:用 HNSW 索引捞 200 条候选集(这一步就是召回)
search_params = {"metric_type": "COSINE", "params": {"nprobe": 10}}
results = collection.search(
    data=[query_vector],
    anns_field="embedding",
    param=search_params,
    limit=200,  # 召回数量 Top-200
    output_fields=["content", "source"]
)

# 4. 后续:把这 200 条传给粗排、精排处理

关键总结

  • 召回的本质 :从全量数据中 "海选" 潜在相关内容,追求 ,不追求
  • 召回率:衡量 "漏没漏相关内容" 的指标,越高越好,但要兼顾效率;
  • 和排序的关系:召回是排序的基础,先召回再排序,才是完整的检索流程。
相关推荐
doiito6 小时前
【Agent Harness】Gliding Horse 上下文感知与智能压缩:让 Agent 的“注意力”永不偏移
ai·rust·架构设计·系统设计·ai agent
doiito1 天前
【Agent Harness】Gliding Horse L2 作战地图深度优化:给多 Agent 上下文装上“精准导航”
ai·rust·架构设计·系统设计·ai agent
妙妙屋(zy)2 天前
Claude Code+CC-Switch+CC-Connect+飞书使用教程
ai
小七-七牛开发者2 天前
Coding Agent 规则管理:CLAUDE.md、Skills、Hooks、Subagents 到底怎么选?
ai·大模型·agent·claude·token·loop·mcp·claudecode·ai coding
doiito2 天前
左脚踩右脚:让 LLM 自进化的 Agent 轨迹训练法——为什么它能补上主流范式的最后一块拼图
ai·系统设计
带刺的坐椅3 天前
从 Claude Code 隐私争议,看 SolonCode 的设计选择
ai·llm·agent·claudecode·soloncode·codingplan
lincats3 天前
Claude Code项目越写越乱?这套清理流程能救你
ai·ai agent·claude code
云燕实验室CloudLab3 天前
《AI开始"抱团"思考了!多智能体 + 思维图到底有多强?》
ai·学习工具·智慧学伴
小七-七牛开发者3 天前
论文解读:DeepSeek DSpark 在真实高并发推理服务中,如何保证 Token 生成又好又快?
ai·大模型·编程·ai coding
doiito3 天前
【Agent Harness】Gliding Horse 核心设计理念,不跟风开发自己的AI Agent
ai·rust·架构设计·系统设计·ai agent