检索增强生成算法

检索增强生成算法(Retrieval-Augmented Generation,RAG)是由Patrick Lewis等人于2020年提出的(https://arxiv.org/pdf/2005.11401),主要用于辅助大规模语言模型(Large Language Models, LLMs)在生成结果之前,查阅/检索外部知识库,得到相关辅助资料,用于"开卷"作答(如果是问答应用模式下),使生成的内容具有除了大模型本身具备的知识以外,有外部知识的支撑和辅助。具体算法的架构图,如下:

图 RAG的算法框架图

其中,如果对于没有应用RAG进行文本生成,只需要图中的生成器部分,x为用户的提示词或者问题等,输入到生成器中,生成器一般使用常用的LLMs进行文本的生成操作。

而RAG加入了检索器模块,论文中使用的外部知识库是wikipedia文章库,针对用户输入x,到外部知识库中进行检索,得到最相关的k篇文章段落。将检索到的相关文章段落与用户输入进行拼接,一起输入到生成器进行生成操作。

一般的文本生成模型就是典型的seq2seq模型,输入和输出都是文本序列。通过文本对训练大型语言模型(LLMs),用户输入文本后使用预训练好的LLMs生成输出文本序列。使用过程完全依赖于LLMs在训练过程中习得的语言技能和知识。

RAG的加入,帮助LLMs使用外部知识,在一定程度上缓解大模型的幻觉问题、非实时性等问题。

(未完待续)

相关推荐
高洁0117 小时前
10分钟了解向量数据库(3
人工智能·深度学习·机器学习·transformer·知识图谱
T112417 小时前
深入解析 OpenCode:下一代 AI 编程助手的架构艺术
typescript·aigc
kimi-22218 小时前
KV Cache(键值缓存)技术
langchain·transformer
小途软件18 小时前
基于深度学习的驾驶人情绪识别
java·人工智能·pytorch·python·深度学习·语言模型
AI生成未来20 小时前
北交&字节最新开源ThinkGen:首次显式利用多模态CoT处理生成任务,多项任务性能SOTA
计算机视觉·aigc·多模态·思维链·视觉生成
z日火20 小时前
腾讯云VOD AIGC视频生成工具 回调实现
aigc·音视频·腾讯云
东方佑20 小时前
SamOutVXP-2601: 轻量级高效语言模型
人工智能·语言模型·自然语言处理
狮子座明仔20 小时前
HierGR:美团外卖搜索的层级语义生成式检索系统
人工智能·深度学习·语言模型·自然语言处理
undsky20 小时前
【n8n教程】:AI Agent节点,构建你的智能自动化机器人
aigc·ai编程
努力改掉拖延症的小白21 小时前
2026年大模型、RAG、智能体、Palantir本体论落地实现业务价值的核心底层逻辑总结
人工智能·语言模型·自动化