什么是RAG(Retrieval-Augmented Generation)?一文读懂检索增强生成

什么是RAG?

RAG是一种结合文档检索(Retrieval)与语言模型生成(Generation)的技术,它的核心思想是:先查资料,再作答

RAG是"知识"和"大模型"的桥梁。

与传统LLM(Large language model,大型语言模型,如chartgpt)不同,RAG不完全依赖模型内部知识,而是将用户的问题与一个外部知识库结合,通过检索获取相关文档,再交由语言模型生成回答。

为什么会有RAG?

RAG的出现,是为了解决传统打语言模型(LLM)在真实应用中的三大痛点:

  1. 知识截止问题:LLM的知识固定在训练时的数据(如GPT-3.5截止到2021年),无法回答新的事实、最新的政策、技术文档更新等问题
  2. 幻觉(Hallucination):LLM可能编造事实,当模型遇到知识空白时,它会"自洽的胡说八道",表面看似合理,实则错误
  3. 无法访问私有知识:无法访问公司内部知识、专属文档、个人数据等非公开内容

RAG的优势

功能 说明
外部知识接入 实时连接知识库,让模型不止靠记忆
提升问答可信度 基于真实内容作答,减少幻觉
支持复杂问答 多文档融合后,能支持长文档或跨文档问答
可快速迭代 只需要更新知识库,无需重复训练模型
企业智能化 支撑内部问答、助手、客服等应用场景

RAG的典型应用场景

  • 客户服务助手
  • 金融文档的自动文档
  • 企业文档助手,客服机器人
  • 医学指南、病例支持

RAG工作流程

如何搭建一个简单的RAG系统

工具选型(可用):

  • 文档向量化:OpenAI Embedding API
  • 向量数据库:FAISS
  • 生成模型(选择已有模型):OpenAI GPT
  • 框架推荐:LangChain、LlamIndex、Haystack

步骤概览:

  1. 文档预处理(切片、清洗)
  2. 文本向量化并存入数据库
  3. 接收用户问题 -> 转成向量 -> 检索相似片段
  4. 将检索内容 + 问题作为Prompt输出LLM生成回答

参考文章

下一步计划

搭建一个软考相关RAG系统。

相关推荐
100个铜锣烧7 分钟前
高级提示技术:Chain-of-Thought与ReAct——让大模型学会“思考”和“行动”
人工智能·大模型·提示词工程
JackHCC24 分钟前
快手OneRetrieval:可编辑生成式电商召回
人工智能·机器学习
yongche_shi43 分钟前
ragas官方文档中文版(五十)
开发语言·python·ai·ragas·如何评估和改进 rag 应用
前端之虎陈随易44 分钟前
编程语言级别的Skill市场,AI Agent 的未来形态
前端·vue.js·人工智能·typescript·node.js
QiLinkOS1 小时前
第三视觉理解徐玉生与他的商业活动(30)
大数据·c++·人工智能·算法·开源协议
武汉唯众智创1 小时前
当汉字成为心理CT:AI汉字联想投射分析的技术实现与心理评估价值
人工智能·ai心理健康·ai心理评估·本土化心理测评·校园心理健康解决方案·ai心理监测·多模态情绪模型
Longvox1 小时前
Agent为什么会死循环?
人工智能·ai编程
陈天伟教授2 小时前
FreeCAD 启动后小窗口闪现即退的解决思路
人工智能·机器人·工业设计
酒旅Agent开发实战2 小时前
AI 旅行规划助手如何接入真实酒旅数据:从自然语言到酒店预订的全流程 MCP 实战
人工智能·ai·旅游·skill·酒店api·机票api
workflower2 小时前
设备单元级(L1)实施路径
人工智能·线性代数·矩阵·机器人·开源