【NLP 61、大模型应用 —— RAG方法】

生活打不败一个大口吃饭的人!

------ 25.4.13

一、模型幻觉问题

模型幻觉(AI Hallucination) 是指人工智能模型(尤其是大语言模型)生成看似合理但实际不准确、虚构或与事实不符内容的现象。其本质是模型基于统计概率"编造"信息,而非通过逻辑推理或真实理解生成结果。


二、RAG(Retrieval Augmented Generation) 检索增强生成

RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合检索生成 的混合方法,常用于问答、对话等任务。其**核心思想是:**在生成答案时,先从外部知识库检索与问题相关的文档,再基于检索结果生成更准确的答案。

1.步骤:

Ⅰ、可信的来源准备多个文档

Ⅱ、 将文档分为多个块或多个文件

Ⅲ、 将每一块作为一个素材存在某一个库中

Ⅳ、 当用户输入一个真实问题时,我们设计一种方法,从这个素材库中召回一个与这个问题相关的片段

Ⅴ、 将这个片段和这个问题一起送入大语言模型进行推理

Ⅵ、 大语言模型相当于同时拿到了问题和相关的片段,对二者进行整合

Ⅶ、 将上一步二者整合出一个答案,进行生成最终的答案(其实是大语言模型从相关文档中进行转述出的结果),提高回答准确率

核心步骤

Ⅰ、文档检索:根据输入问题,从知识库中检索相关文档片段

Ⅱ、答案生成:将检索到的文档和问题一起输入生成模型,生成最终答案

RAG 关键组件详解

组件 作用 常用工具/模型
检索器 从知识库中查找相关文档 BM25、DPR、FAISS
生成器 基于检索结果生成自然语言答案 BART、T5、GPT-2/3
知识库 存储结构化/非结构化数据 Wikipedia、自定义数据库

2.流程图

流程图 Ⅰ

流程图 Ⅱ

流程图 Ⅲ


三、RAG优势

(1)可扩展性:减少 模型大小和训练成本,并能够快速扩展知识。

(2)准确性: 模型基于事实进行回答,减少幻觉的发生。

(3)可控性: 允许更新和定制知识。

(4)可解释性: 检索到的相关信息作为模型预测中来源的参考

(5)多功能性: RAG能够针对多种任务进行微调(提示词)和定制(),如QA、Summary、Dialogue等。


四、RAG难点

1.Missing Content:数据库中缺少相关的问题

2.**Missed Top Ranked:**没有取到正确的文章(检索系统的问题)

3.Not in Context:必要信息流失

4.Wrong Format:输出格式错误

5.Incomplete:输出内容不完整(检索系统的问题)

6.**Not Extracted:**模型没有回答出正确答案(大模型能力的要求)

7.incorrect specificity:模型在处理某些特定情况时不够精确,导致错误或异常。


五、RAG的延伸

1.MemWalker

**Ⅰ、**先按照段落区分

**Ⅱ、**利用大模型的摘要能力,按照段落生成一个每一个段落对应的总结

**Ⅲ、**将每个段落的总结放在一起进行总结,生成总结的总结

**Ⅳ、**循环生成总结的总结,最终形成一个树形结构

**Ⅴ、**从根节点寻找,哪个子节点的总结与问题更加接近,就逐层寻找其子节点总结与问题的相似度


2.Read Agent

**思路:**把RAG中检索的任务也交给大模型去做

**Ⅰ、**输入一段文本输入到大模型中

**Ⅱ、**让模型决定这段文本在哪里可以断句

**Ⅲ、**经过第Ⅱ步,这篇文章被断成了几段,对于每段文本再送入大模型让模型对其进行一些摘要

**Ⅳ、**在查找时,传入每段文本的摘要,通过摘要的内容,让模型决定需不需要展开看到整段文本


3.Corrective RAG

思路:输入一个问题先进行检索,检索出文章后让大模型回答是否输入的问题与检索的文章之间存在相关性。如果模型认为有相关性【Correct】:则直接使用本地知识库进行回答;如果模型认为没有相关性【Incorrect】: 则模型会进行网络检索的过程,不依赖本地知识库;如果模型认为有一定相关性**【Ambiguous】:**则会同时在本地知识库和网络中同时查找;


4.self RAG

思路:输入一个问题,先判断一下是否需要做召回;如果需要做召回 ,就去本地知识库中做检索,再由大语言模型预测答案是否与问题相关;如果不需要做召回,就直接在网络查找输入答案,大模型最终再判断校验自己输入的答案是否有意义;

相关推荐
牛客企业服务39 分钟前
2025年AI面试推荐榜单,数字化招聘转型优选
人工智能·python·算法·面试·职场和发展·金融·求职招聘
视觉语言导航1 小时前
RAL-2025 | 清华大学数字孪生驱动的机器人视觉导航!VR-Robo:面向视觉机器人导航与运动的现实-模拟-现实框架
人工智能·深度学习·机器人·具身智能
**梯度已爆炸**1 小时前
自然语言处理入门
人工智能·自然语言处理
ctrlworks2 小时前
楼宇自控核心功能:实时监控设备运行,快速诊断故障,赋能设备寿命延长
人工智能·ba系统厂商·楼宇自控系统厂家·ibms系统厂家·建筑管理系统厂家·能耗监测系统厂家
BFT白芙堂2 小时前
睿尔曼系列机器人——以创新驱动未来,重塑智能协作新生态(上)
人工智能·机器学习·机器人·协作机器人·复合机器人·睿尔曼机器人
aneasystone本尊2 小时前
使用 MCP 让 Claude Code 集成外部工具
人工智能
静心问道2 小时前
SEW:无监督预训练在语音识别中的性能-效率权衡
人工智能·语音识别
羊小猪~~3 小时前
【NLP入门系列五】中文文本分类案例
人工智能·深度学习·考研·机器学习·自然语言处理·分类·数据挖掘
xwz小王子3 小时前
从LLM到WM:大语言模型如何进化成具身世界模型?
人工智能·语言模型·自然语言处理
我爱一条柴ya3 小时前
【AI大模型】深入理解 Transformer 架构:自然语言处理的革命引擎
人工智能·ai·ai作画·ai编程·ai写作