【AI面试临阵磨枪-47】RAG 1.0 / 2.0 / 3.0 演进与区别

一、面试题目

请说明 RAG 1.0、RAG 2.0、RAG 3.0 的技术演进、核心架构差异、各自解决痛点、关键技术特征与工业级落地区别。

二、知识储备

1. 整体演进思路

RAG 三代演进本质是从简单向量检索拼接 ，迭代到全链路精细化优化 ，再升级为模块化智能体编排。不再只是文档问答工具，而是沿着「能用→好用→智能复杂推理」路线升级，从检索、分块、编排、推理、迭代能力逐层进化，形成可量化、可迭代、可复杂落地的三代技术体系。

2. 各版本定义、架构特征、痛点、关键技术、优化方向

1）RAG 1.0 朴素版 Naive RAG

定义最基础的原生检索增强生成，仅由文档切块、向量检索、上下文拼接、大模型生成四步组成，无任何链路优化，是 RAG 最初始形态。

核心架构流程原始文档 → 固定长度硬切块 → 向量化入库 → 用户提问向量匹配 → Top-K 检索结果直接拼接 Prompt → LLM 一次性生成答案

核心痛点

固定窗口硬切块，割裂文档语义与逻辑结构
仅依赖向量相似度检索，关键词匹配弱、召回噪声大
无查询改写、无重排序、无结果过滤
幻觉严重、信息碎片化、复杂多轮问题无法处理
上下文冗余杂乱，容易偏离用户意图

评估口径任务成功率偏低、幻觉率高、仅适配简单单轮短句问答。

关键特征固定分块、纯向量检索、无链路优化、无校验反思、紧耦合架构、只能做简单知识库问答。

优化局限只能做 Demo 验证，无法满足工业级精准问答、专业领域复杂咨询场景。

2）RAG 2.0 进阶版 Advanced RAG

定义在 RAG 1.0 基础上做全链路端到端优化，覆盖检索前、检索中、检索后、生成侧全流程优化，是当前工业级落地主流版本。

核心架构流程文档 → 语义智能分块 / 层次分块 → 向量化索引用户提问 → 意图识别 + 查询改写 / 扩展 → 向量 + BM25 混合检索 → Reranker 重排序过滤 → 上下文压缩去重 → 约束 Prompt 生成 → 引用溯源 + 事实校验

解决痛点解决 1.0 检索不准、语义断裂、噪声过多、幻觉高发、专业领域问答不准等核心问题。

关键升级技术

检索前：查询改写、HyDE、多视角问句生成、意图拆解
检索中：向量语义检索 + BM25 关键词检索混合模式
检索后：重排序模型二次精排、片段去重、摘要压缩
生成侧：强约束 Prompt、引用溯源、事实校验、幻觉拦截

评估口径任务成功率大幅提升、检索精准度显著提高、幻觉率可控，适配企业知识库、内部文档、客服问答等工业场景。

优化方向持续迭代嵌入模型、Reranker 模型、分块策略、Prompt 工程，在精准度和响应延迟之间做平衡。

3）RAG 3.0 智能体版 Agentic RAG

定义融合模块化架构与 AI Agent 能力的下一代 RAG，具备任务规划、动态路由、多轮迭代检索、工具调用、反思修正、长上下文管理能力，支持复杂多跳推理与跨文档复杂任务。

核心架构流程用户复杂提问 → 意图理解 & 任务规划 DAG → 动态路由选择知识库 / 工具 → 多轮迭代检索 → 记忆上下文管理 → 工具调用协同 → 生成 + 反思校验 → 二次检索修正 → 输出带溯源答案

解决痛点解决 RAG 2.0 无法处理多轮对话、多跳推理、跨文档关联、复杂拆解任务、外部工具联动的短板。

关键升级技术

模块化可插拔架构：索引、检索、编排、记忆、生成独立可替换
Agent 能力：子任务拆解、规划编排、迭代自省
高级检索：GraphRAG 知识图谱融合、递归摘要 RAPTOR、超长上下文管理
多轮闭环：生成→反思→校验→二次检索修正
工具联动：对接数据库、API、计算器、代码解释器

评估口径任务成功率最高、支持复杂推理、多轮对话流畅、幻觉率极低，适合科研文献分析、法律案情推理、复杂企业智能助手等高阶场景。

3. RAG 三代核心维度对比

表格

|----------|----------------|--------------------|--------------------|
| 对比维度 | RAG 1.0 | RAG 2.0 | RAG 3.0 |
| 核心定位 | 基础 Demo 版 | 工业落地主流版 | 智能体高阶复杂版 |
| 分块方式 | 固定长度硬切块 | 语义分块、层次分块 | 智能分块 + 递归摘要 |
| 检索方式 | 纯向量相似度检索 | 向量 + BM25 混合 + 重排序 | 动态路由 + 迭代检索 + 知识图谱 |
| 问题处理能力 | 仅简单单轮问答 | 常规业务问答、单跳检索 | 多轮、多跳、跨文档复杂推理 |
| 幻觉控制 | 幻觉严重 | 可控低幻觉 | 极低幻觉 + 反思自修正 |
| 架构特性 | 紧耦合、不可扩展 | 流水线优化、扩展性一般 | 模块化可插拔、可编排 |
| 附加能力 | 无额外能力 | 溯源、事实校验 | 任务规划、工具调用、记忆、反思迭代 |
| 落地场景 | 个人 Demo、简单文档测试 | 企业知识库、客服、内部问答 | 科研、法律、复杂智能助手、平台级应用 |

4. 工业级落地选用基线

简单轻量化场景、快速原型验证：选用 RAG 1.0
企业常规知识库、业务问答、私有化部署：选用 RAG 2.0 作为标准基线
复杂多轮推理、多文档关联、需要工具编排：升级 RAG 3.0 Agentic RAG

三、破局之道

面试高阶满分表述：RAG 1.0、2.0、3.0 的演进，是从单纯检索拼接 到全链路精细化优化 ，再到模块化智能体编排的升级过程。RAG 1.0 只能解决简单文档检索问答，架构简陋、幻觉高、精准度差；RAG 2.0 通过查询改写、混合检索、重排序、事实校验全链路优化，把 RAG 推向工业可用，是目前企业落地主流；RAG 3.0 融合 AI Agent 规划、迭代检索、反思修正与工具调用，突破传统 RAG 只能单跳问答的局限，具备复杂任务拆解和多轮推理能力。

三代不是替代关系而是递进关系，工程落地要按场景选型：简单原型用 1.0，标准企业业务用 2.0，复杂高阶智能场景用 3.0，同时在准确率、延迟、成本之间做均衡迭代。

四、代码实现

Python 三代 RAG 简易架构模拟

python 复制代码

# RAG 1.0 朴素版
class RAG1Evaluator:
    def __init__(self):
        self.simple_task_total = 0
        self.simple_task_success = 0

    def record_task(self, is_success: bool):
        self.simple_task_total += 1
        if is_success:
            self.simple_task_success += 1

    def get_metrics(self):
        rate = self.simple_task_success / self.simple_task_total if self.simple_task_total else 0
        return {"任务成功率": round(rate * 100, 2)}

# RAG 2.0 进阶版
class RAG2Evaluator:
    def __init__(self):
        self.total_task = 0
        self.success_task = 0
        self.re_rank_correct = 0

    def record_task(self, is_success: bool, re_rank_ok: bool):
        self.total_task += 1
        if is_success:
            self.success_task += 1
        if re_rank_ok:
            self.re_rank_correct += 1

    def get_metrics(self):
        success_rate = self.success_task / self.total_task if self.total_task else 0
        re_rank_rate = self.re_rank_correct / self.total_task if self.total_task else 0
        return {
            "任务成功率": round(success_rate * 100, 2),
            "重排序准确率": round(re_rank_rate * 100, 2)
        }

# RAG 3.0 智能体版
class RAG3Evaluator:
    def __init__(self):
        self.total_task = 0
        self.success_task = 0
        self.reflect_correct = 0
        self.iter_retrieval_times = []

    def record_task(self, is_success: bool, reflect_ok: bool, iter_step: int):
        self.total_task += 1
        if is_success:
            self.success_task += 1
        if reflect_ok:
            self.reflect_correct += 1
        self.iter_retrieval_times.append(iter_step)

    def get_metrics(self):
        import statistics
        success_rate = self.success_task / self.total_task if self.total_task else 0
        reflect_rate = self.reflect_correct / self.total_task if self.total_task else 0
        avg_iter = statistics.mean(self.iter_retrieval_times) if self.iter_retrieval_times else 0
        return {
            "复杂任务成功率": round(success_rate * 100, 2),
            "反思修正成功率": round(reflect_rate * 100, 2),
            "平均迭代检索步数": round(avg_iter, 2)
        }

JavaScript 版本

javascript 复制代码

// RAG 1.0
class RAG1Evaluator {
  constructor() {
    this.simpleTaskTotal = 0;
    this.simpleTaskSuccess = 0;
  }
  recordTask(isSuccess) {
    this.simpleTaskTotal++;
    if (isSuccess) this.simpleTaskSuccess++;
  }
  getMetrics() {
    const rate = this.simpleTaskTotal ? this.simpleTaskSuccess / this.simpleTaskTotal : 0;
    return { "任务成功率": (rate * 100).toFixed(2) };
  }
}

// RAG 2.0
class RAG2Evaluator {
  constructor() {
    this.totalTask = 0;
    this.successTask = 0;
    this.reRankCorrect = 0;
  }
  recordTask(isSuccess, reRankOk) {
    this.totalTask++;
    if (isSuccess) this.successTask++;
    if (reRankOk) this.reRankCorrect++;
  }
  getMetrics() {
    const successRate = this.totalTask ? this.successTask / this.totalTask : 0;
    const reRankRate = this.totalTask ? this.reRankCorrect / this.totalTask : 0;
    return {
      "任务成功率": (successRate * 100).toFixed(2),
      "重排序准确率": (reRankRate * 100).toFixed(2)
    };
  }
}

// RAG 3.0
class RAG3Evaluator {
  constructor() {
    this.totalTask = 0;
    this.successTask = 0;
    this.reflectCorrect = 0;
    this.iterRetrievalTimes = [];
  }
  recordTask(isSuccess, reflectOk, iterStep) {
    this.totalTask++;
    if (isSuccess) this.successTask++;
    if (reflectOk) this.reflectCorrect++;
    this.iterRetrievalTimes.push(iterStep);
  }
  avg(arr) {
    if (arr.length === 0) return 0;
    return arr.reduce((a, b) => a + b, 0) / arr.length;
  }
  getMetrics() {
    const successRate = this.totalTask ? this.successTask / this.totalTask : 0;
    const reflectRate = this.totalTask ? this.reflectCorrect / this.totalTask : 0;
    const avgIter = this.avg(this.iterRetrievalTimes);
    return {
      "复杂任务成功率": (successRate * 100).toFixed(2),
      "反思修正成功率": (reflectRate * 100).toFixed(2),
      "平均迭代检索步数": avgIter.toFixed(2)
    };
  }
}