RAG究竟是什么？一文搞懂大模型的记忆增强术

Jackson__2025-08-17 17:08

写在前面

想象一下，你是个健忘的程序员（相信我，这不需要太多想象力）。有一天，产品经理问你："咱们去年做的那个xxx系统，用的什么算法来着？"

你一脸懵逼，挠挠头说："这...我想想啊...好像是...呃..."

这时候你会怎么办？当然是翻文档、查Git提交记录、问问当时参与的同事，对吧？

RAG就是让大模型学会了这个技能 ------ 不知道的时候，先去翻翻资料，再来回答问题。

RAG到底是啥？

RAG的全称是 Retrieval-Augmented Generation，直译过来就是"检索增强生成"。听起来还是很学术，咱们换个说法：

RAG = 临时抱佛脚 + 现学现卖

传统的大模型就像是一个博学但固执的老教授，只会用脑子里已有的知识来回答问题。如果你问他2025年发生了什么，他可能还停留在2024年的认知里。

而RAG就像是给这个老教授配了个助理，专门负责实时查资料。当有人问问题时，助理先去翻最新的资料，然后把相关信息递给教授，教授再结合这些信息给出回答。

举个栗子🌰

比如你想开发一个客服机器人，用来回答公司产品的相关问题。

传统方式的问题

如果直接用ChatGPT：

用户：你们的Pro版本支持多少个并发连接？

ChatGPT：抱歉，我不知道您具体指的是哪个产品的Pro版本...

完全没用，对吧？

用了RAG之后

用户问：你们的Pro版本支持多少个并发连接？
RAG系统想：我得先查查相关资料
检索阶段：系统在产品文档库里搜索，找到：

- "Pro版本技术规格.md"
- "并发连接限制说明.md"
- "版本对比表.xlsx"

生成阶段：把找到的资料喂给大模型，大模型回答：

"根据我们的产品文档，Pro版本支持最多10,000个并发连接。如果您需要更高的并发量，可以考虑企业版，支持50,000个并发连接。"

看到没？这就是RAG的威力！

RAG的工作流程

整个流程可以分成几个步骤，可以用做菜来比喻：

1. 准备食材（数据准备）

就像做菜前要买菜、洗菜、切菜一样，RAG需要先准备知识库：

收集各种文档（Word、PDF、网页等）
把长文档切成小块（chunk）
转成向量存起来

2. 找食材（检索阶段）

用户提问后，系统会：

理解用户问题的意思
在知识库里找相关的信息
挑出最相关的几条

3. 下锅炒菜（生成阶段）

把找到的信息和用户问题一起丢给大模型：

模型结合检索到的信息
生成准确、有针对性的回答

实际应用

电商客服

某电商平台用RAG做智能客服：

用户：这个手机壳适合iPhone 15 Pro Max吗？

系统：检索产品详情、兼容性信息

回答：这款手机壳完全适合iPhone 15 Pro Max，采用了精确开孔设计，不会影响摄像头和充电口的使用...

RAG的优势

1. 实时性强

不像传统模型需要重新训练，RAG可以随时更新知识库，立马就能用上最新信息。

2. 成本低

不需要重新训练大模型，只需要维护知识库就行。

3. 可控性好

可以明确知道回答是基于哪些资料，便于审核和调优。

4. 专业性强

在特定领域，RAG往往比通用大模型更靠谱。

RAG的坑点

当然，RAG也不是万能的，包括：

1. 检索质量问题

有时候检索到的信息不够准确，就像你想找"苹果手机"，结果给你找了一堆"苹果水果"的信息。

2. 信息冲突

知识库里可能有相互矛盾的信息，这时候模型就懵了。

3. 上下文长度限制

检索到太多信息，可能超出模型的处理能力。

4. 知识库更新慢

新信息难以及时加入，回答可能过时。

5. 隐私安全隐患

可能泄露库中敏感信息，有被攻击风险。

技术实现的小提示

1. 文档切分要合理

按段落切分，而不是按固定字数
保持语义完整性
块与块之间可以有一些重叠

2. 检索策略优化

不要只看相似度，还要考虑多样性
可以用重排序模型进一步优化
结合关键词检索和向量检索

写在最后

RAG确实是个好东西，它让大模型从"只会背书的学生"变成了"会查资料的研究生"。在很多实际应用场景中，RAG的效果往往比单纯的大模型要好得多。

不过，RAG也不是万能的，它有自己的适用场景和局限性。关键是要根据具体需求，选择合适的技术方案。

上一篇：Zabbix【部署 02】Zabbix-Java-Gateway安装配置使用（使用Zabbix-Java-Gateway通过JMX监控Java应用程序实例分享）

下一篇：我不想再学新框架了，直到我遇见了 ZipAgent

热门推荐

01BongoCat - 跨平台键盘猫动画工具 02GitHub 镜像站点 03UV安装并设置国内源 04Linux下V2Ray安装配置指南 05jdk21下载、安装（Windows、Linux、macOS）06GitLab 零基础入门指南：从安装到项目管理全流程 07NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 08KGG转MP3工具|非KGM文件|解密音频 09Labelme从安装到标注：零基础完整指南 10在VSCode配置Java开发环境的保姆级教程（适配各类AI编程IDE）