啥是RAG 它能干什么？

曦月逸霜2026-05-15 23:58

RAG工作机制详解

前言
- 为什么需要学习RAG？
- [传统模型 vs. Agent](#传统模型 vs. Agent)
前置知识补充
- [1. Token（词元）](#1. Token（词元）)
- [2. Embedding（嵌入）](#2. Embedding（嵌入）)
- [3. 大语言模型Embedding vs. RAG Embedding](#3. 大语言模型Embedding vs. RAG Embedding)
为什么需要RAG？
- 实际应用场景
RAG的基本运行流程
回顾
- 结语

前言

为什么需要学习RAG？

RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合了信息检索与大语言模型生成能力的技术。与传统模型相比，RAG能够从外部知识库中检索相关信息，再基于这些信息生成更准确、更可靠的回答。

闲聊：好久没写博客了现在除了原本的Chat功能现在居然也支持agent 你现在看到的开头的这段介绍都是agent自动帮我插入的，编辑页面也经过了优化，CSDN真是紧跟时代发展！

BZW：最后整个排版也是 agent 自动帮我优化的我只需要自己再微调一下就可以了有点小龙虾------博客版的味道了^ _^

传统模型 vs. Agent

传统模型：回答"如何预订酒店"时，仅提供文字步骤。
Agent：直接调用预订API，完成订单并返回确认信息。

前置知识补充

1. Token（词元）

我们在与大模型对话时输入的是文字，但在喂给大模型之前都需要先进行Token化。

为什么需要Token化？

单词在计算机中以字符形式存储，如果大模型每次都要从字符组合成单词，效率太低。
通过建立Token词典，可以将"apple"转化为数字"1"，大大提高处理效率。
将字词或部分字词转化为数字的过程就叫做Tokenizer。

2. Embedding（嵌入）

如果说Tokenizer是将用户输入的文字转化为数字，那么Embedding就是把这些数字转化为向量。

Embedding的优势：

可以表示不同维度上的关系远近
例如：香蕉和苹果除了都是中文和水果外，在其他方面区别很大
而"苹果"对应的不同翻译（如"apple"），除了语言差异外，都指同一个东西
单一维度无法满足需求，需要Embedding进行向量化表示

3. 大语言模型Embedding vs. RAG Embedding

重要区别：

大语言模型的Embedding：主要用于理解输入文本的语义
RAG的Embedding：目的是概括一段话，提取关键信息

RAG Embedding的工作流程：

模型输出Embedding向量
经过线性层处理
将向量转化为便于理解的Token

为什么需要RAG？

实际应用场景

现在我们在学校或公司网站上，总能在右下角看到一个"智能管家"来帮助解答问题，我们当然可以在询问的时候丢给他一个系统的使用手册但是这往往就会导致很多问题：

如果你常用AI帮助你解决问题那么这其实是很常见的比如我们丢给豆包一片研究生论文很大概率都会出现由于文档内容太长只能读取前80% 这就是涉及到上下文窗口大小的一个问题
而输入太多就会导致token的消耗很大对应的就是成本变高和速度变慢这是非常好理解的
所以这个时候就需要我们RAG登场了下面对于RAG基本运行流程的分析就可以让你基本理解为什么RAG可以很好的解决这些问题

RAG的基本运行流程

核心步骤：

索引
召回
重排

召回和重排的区别
有的人就说直接在召回阶段选出前三个最相似的不就行了吗干嘛非得再次重排简直是多此一举其实关键是在于他们的筛选逻辑是不同的

生成

我们拿到了上面的结果之后就可以喂给大模型了我个人理解的就像是:
期末考试的时候你发现你一个学期啥也没学这个时候大的来了老师最后一节课把题库或者说是考试范围和重点给你在书上圈好了你虽然铲了一学期依旧能够凭借这份资料高分通过期末考试

回顾

整体的流程可以分为提问前和提问后
提问前的准备工作
提问后

结语

那么RAG的有关内容就到这里了感谢你的关注 ~
希望看到这里的你有美好的一天我明天还有个面试那也祝我好运吧 ~ ------5.14日晚於实验楼

上一篇：Lancet Digit Health（IF=24.1）广东省人民医院刘再毅&amp；南方医科大学南方医院梁莉等团队：基于可解释深度学习模型预测胶质瘤分子改变

下一篇：Claude Code Agent Teams：多 Agent 协作的生命周期与实现机制

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 05AI科技热点日报 | 2026年07月01日 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08【AI前线观察】2026年国产开源大模型全面横评：从 DeepSeek V4 到 Kimi K3，谁才是开发者的最优选择？092026 年 AI 大模型 & AI 编程工具实战全总结 102026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？