rag学习笔记

目录

rag原理:

[RAG 的核心原理分步解析](#RAG 的核心原理分步解析)

[1. 用户提问(Query)](#1. 用户提问(Query))

[2. 检索(Retrieval)](#2. 检索(Retrieval))

[3. 增强提示(Augmented Prompt)](#3. 增强提示(Augmented Prompt))

[4. 生成(Generation)](#4. 生成(Generation))

[5. 输出最终答案](#5. 输出最终答案)

扩展:高级RAG技术


rag原理:

一文带你速通RAG、知识库和LLM!_rag知识库-CSDN博客

RAG(Retrieval-Augmented Generation,检索增强生成)是一种将信息检索文本生成 相结合的技术,旨在提升大语言模型(LLM)生成内容的准确性、时效性和事实性。其核心原理是通过实时检索外部知识源来补充LLM的内部知识,从而生成更可靠的回答。

RAG 的核心原理分步解析

以下是RAG工作流程的详细拆解:

1. 用户提问(Query)
  • 用户输入一个问题或指令(例如:"量子计算的最新突破有哪些?")。
2. 检索(Retrieval)
  • 语义检索 :将用户问题转化为向量(Embedding),在向量数据库中搜索语义相似的文档片段。

  • 知识来源:数据库可包含PDF、网页、企业文档、研究论文等结构化/非结构化数据。

  • 返回结果:系统返回Top-K个最相关的文本片段(例如:3-5个相关段落)。

3. 增强提示(Augmented Prompt)
  • 将检索到的文本片段与用户问题拼接,形成新的提示词(Prompt):

    复制代码
    根据以下信息回答问题:
    [检索到的文本片段1]
    [片段2]
    ...
    问题:{用户原始提问}
  • 示例提示:

    上下文:2024年IBM发布了量子处理器"Heron",错误率降低至...

    问题:量子计算的最新突破有哪些?

4. 生成(Generation)
  • LLM基于增强后的提示生成回答:

    • 模型会优先依赖检索到的权威信息,而非仅凭训练数据中的记忆。

    • 生成结果通常包含引用来源(如:"根据IBM 2024年的报告...")。

5. 输出最终答案
  • 生成融合了检索信息的自然语言回复,并确保关键事实与检索内容一致。

扩展:高级RAG技术

  • HyDE:先让LLM生成假设答案,再用其Embedding检索更相关文档。

  • 递归检索:对检索结果进一步检索,实现多跳推理。

  • 重排序(Re-Rank):用更精细的模型对检索结果二次排序。

相关推荐
墨雨听阁5 分钟前
8.1IO进程线程——文件IO函数
学习
Chef_Chen19 分钟前
从0开始学习R语言--Day64--决策树回归
学习·决策树·r语言
无望__wsk1 小时前
ospf笔记
服务器·网络·笔记
Aplis1 小时前
ETCD学习之路
数据库·学习·etcd
玖剹1 小时前
Linux文件系统:从内核到缓冲区的奥秘
linux·c语言·c++·笔记·ubuntu
知识分享小能手1 小时前
Vue3 学习教程,从入门到精通,Vue3 中使用 Axios 进行 Ajax 请求的语法知识点与案例代码(23)
前端·javascript·vue.js·学习·ajax·vue·vue3
凤年徐2 小时前
【数据结构与算法】21.合并两个有序链表(LeetCode)
c语言·数据结构·c++·笔记·算法·链表
小一亿2 小时前
【0基础PS】PS工具详解--仿制图章工具
学习·平面·adobe·信息可视化·媒体·photoshop
淮北4946 小时前
STL学习(十一、常用的算数算法和集合算法)
c++·vscode·学习·算法
_Kayo_9 小时前
VUE2 学习笔记14 nextTick、过渡与动画
javascript·笔记·学习