rag学习笔记

AI视觉网奇2025-07-09 11:41

目录

[RAG 的核心原理分步解析](#RAG 的核心原理分步解析)

[1. 用户提问（Query）](#1. 用户提问（Query）)

[2. 检索（Retrieval）](#2. 检索（Retrieval）)

[3. 增强提示（Augmented Prompt）](#3. 增强提示（Augmented Prompt）)

[4. 生成（Generation）](#4. 生成（Generation）)

[5. 输出最终答案](#5. 输出最终答案)

扩展：高级RAG技术

rag原理:

一文带你速通RAG、知识库和LLM！_rag知识库-CSDN博客

RAG（Retrieval-Augmented Generation，检索增强生成）是一种将信息检索 与文本生成 相结合的技术，旨在提升大语言模型（LLM）生成内容的准确性、时效性和事实性。其核心原理是通过实时检索外部知识源来补充LLM的内部知识，从而生成更可靠的回答。

RAG 的核心原理分步解析

以下是RAG工作流程的详细拆解：

1. 用户提问（Query）

用户输入一个问题或指令（例如："量子计算的最新突破有哪些？"）。

2. 检索（Retrieval）

语义检索 ：将用户问题转化为向量（Embedding），在向量数据库中搜索语义相似的文档片段。
知识来源：数据库可包含PDF、网页、企业文档、研究论文等结构化/非结构化数据。
返回结果：系统返回Top-K个最相关的文本片段（例如：3-5个相关段落）。

3. 增强提示（Augmented Prompt）

将检索到的文本片段与用户问题拼接，形成新的提示词（Prompt）：

复制代码

根据以下信息回答问题：
[检索到的文本片段1]
[片段2]
...
问题：{用户原始提问}

示例提示：

上下文：2024年IBM发布了量子处理器"Heron"，错误率降低至...

问题：量子计算的最新突破有哪些？

4. 生成（Generation）

LLM基于增强后的提示生成回答：
- 模型会优先依赖检索到的权威信息，而非仅凭训练数据中的记忆。
- 生成结果通常包含引用来源（如："根据IBM 2024年的报告..."）。

5. 输出最终答案

生成融合了检索信息的自然语言回复，并确保关键事实与检索内容一致。

扩展：高级RAG技术

HyDE：先让LLM生成假设答案，再用其Embedding检索更相关文档。
递归检索：对检索结果进一步检索，实现多跳推理。
重排序（Re-Rank）：用更精细的模型对检索结果二次排序。

上一篇：原生微信小程序最实用的工具函数合集

下一篇：讲解instanceof 用法

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05AI科技热点日报 | 2026年07月01日 06幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 09【解构】DeepSeek V4 发布：技术报告深度解读 + 横向对比六大开源模型，我们的判断是……102026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？