RAG-day9

Komorebi_99992026-05-13 13:58

一、稀疏检索 & 稠密检索（最核心，先搞懂这俩）

1. 稀疏检索

人话：按关键词匹配 就像百度搜东西，你输几个字，它找包含这些字的文章。

只认字面关键词
不懂语义、不懂意思
代表工具：**ElasticSearch（ES）**适合：找专有名词、专业术语、法规编号、固定关键词。

举例子：你搜 "乌干达鲜鱼检疫标准"稀疏检索只找包含这几个字的文档。

2. 稠密检索

人话：按意思匹配，不看字面 不管字一不一样，意思相近就给你找出来。靠向量 Embedding 计算语义相似度。

懂语义、懂含义
不依赖关键词
代表：所有向量数据库（Milvus/FAISS）

举例子：搜 "进口鱼类入境要求"哪怕文章里没这句原话，意思一样，也能搜到。

一句话记住区别

稀疏：对字（关键词匹配）
稠密：对意（语义匹配）

二、多路混合检索（RAG 工业级必用）

单独用一个都有缺点：

只用 ES 稀疏：关键词少就搜不到，不懂语义
只用向量稠密：没有关键词时容易搜到不相关的

混合检索 = 稀疏检索 + 稠密检索一起用两边结果合并、打分、排序。

好处：

关键词能精准命中专业名词
语义能搜到意思相近的内容
不漏、不杂，检索质量直接拉满

面试一句话背：ES 做关键词稀疏检索，向量库做语义稠密检索，两者多路融合，提升召回和精准度。

三、Rerank 重排（必考点，超好懂）

干啥的？

前面混合检索先捞出一批候选内容，Rerank 再精细筛选一遍，重新排队，把最相关的放前面，没用的往后挪或删掉。

通俗流程

检索阶段：先粗选，捞出 Top10--Top20 一堆内容
Rerank 重排模型：挨个打分、判断相关性
只留最匹配的 Top3--Top5 给大模型

作用

过滤垃圾无关内容
减少大模型上下文负担
提升答案准确度、减少幻觉

记住一句：先粗搜，再精排，Rerank 负责二次筛选重新排序。

四、Query 改写（用户问题优化）

用户提问有时候：太短、太口语、意思模糊。比如用户只说："进口鱼有啥要求？"太简略，检索搜不准。

Query 改写做三件事：

把短句补全成完整专业问句
口语改成书面专业表述
拆分多意图问题，拆成多个子问题

目的：让检索更容易搜到精准内容。

五、上下文压缩

检索出来的内容可能又长又啰嗦，有废话、有无关段落。上下文压缩就是：把多余废话删掉，只保留和问题相关的关键句子，精简后再给大模型。

好处：

节省 token
加快生成速度
减少无关信息干扰，降低幻觉

六、RAG 常见链路完整流程（Day8+Day9 合起来完整版）

我给你串成一条完整流水线，超好记：文档入库 → 高级分块 → 生成 Embedding 存入向量库 + ES 建索引用户提问 → Query 改写 → 多路混合检索（ES + 向量）→ Rerank 重排 → 上下文压缩 → 喂给大模型生成答案

七、给你整理 Day9 必背极简口诀

稀疏对字，稠密对意
ES 稀疏找关键词，向量稠密找语义
混合检索两路合并，不漏不杂
先粗搜，后精排，Rerank 做重排
Query 改写补全问题，方便检索
上下文压缩删减废话，精简输入

上一篇：Linux 系统调用与接口层

下一篇：AI Agent 构建操作指南

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03AI科技热点日报 | 2026年07月01日 04幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 05如何新建文件夹？电脑新建文件夹的4种方法 06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 07国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）082026年AI技术突破与产业落地全景：从GPT-5到多模态智能体的新纪元 092026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？10全面体验 Grok API 中转站（2025 · Grok 4 系列最新版）