rag学习笔记

目录

rag原理:

[RAG 的核心原理分步解析](#RAG 的核心原理分步解析)

[1. 用户提问(Query)](#1. 用户提问(Query))

[2. 检索(Retrieval)](#2. 检索(Retrieval))

[3. 增强提示(Augmented Prompt)](#3. 增强提示(Augmented Prompt))

[4. 生成(Generation)](#4. 生成(Generation))

[5. 输出最终答案](#5. 输出最终答案)

扩展:高级RAG技术


rag原理:

一文带你速通RAG、知识库和LLM!_rag知识库-CSDN博客

RAG(Retrieval-Augmented Generation,检索增强生成)是一种将信息检索文本生成 相结合的技术,旨在提升大语言模型(LLM)生成内容的准确性、时效性和事实性。其核心原理是通过实时检索外部知识源来补充LLM的内部知识,从而生成更可靠的回答。

RAG 的核心原理分步解析

以下是RAG工作流程的详细拆解:

1. 用户提问(Query)
  • 用户输入一个问题或指令(例如:"量子计算的最新突破有哪些?")。
2. 检索(Retrieval)
  • 语义检索 :将用户问题转化为向量(Embedding),在向量数据库中搜索语义相似的文档片段。

  • 知识来源:数据库可包含PDF、网页、企业文档、研究论文等结构化/非结构化数据。

  • 返回结果:系统返回Top-K个最相关的文本片段(例如:3-5个相关段落)。

3. 增强提示(Augmented Prompt)
  • 将检索到的文本片段与用户问题拼接,形成新的提示词(Prompt):

    复制代码
    根据以下信息回答问题:
    [检索到的文本片段1]
    [片段2]
    ...
    问题:{用户原始提问}
  • 示例提示:

    上下文:2024年IBM发布了量子处理器"Heron",错误率降低至...

    问题:量子计算的最新突破有哪些?

4. 生成(Generation)
  • LLM基于增强后的提示生成回答:

    • 模型会优先依赖检索到的权威信息,而非仅凭训练数据中的记忆。

    • 生成结果通常包含引用来源(如:"根据IBM 2024年的报告...")。

5. 输出最终答案
  • 生成融合了检索信息的自然语言回复,并确保关键事实与检索内容一致。

扩展:高级RAG技术

  • HyDE:先让LLM生成假设答案,再用其Embedding检索更相关文档。

  • 递归检索:对检索结果进一步检索,实现多跳推理。

  • 重排序(Re-Rank):用更精细的模型对检索结果二次排序。

相关推荐
Hello_Embed20 小时前
STM32HAL 快速入门(二十):UART 中断改进 —— 环形缓冲区解决数据丢失
笔记·stm32·单片机·学习·嵌入式软件
咸甜适中20 小时前
rust语言 (1.88) 学习笔记:客户端和服务器端同在一个项目中
笔记·学习·rust
Grassto20 小时前
RAG 从入门到放弃?丐版 demo 实战笔记(go+python)
笔记
Magnetic_h21 小时前
【iOS】设计模式复习
笔记·学习·ios·设计模式·objective-c·cocoa
研梦非凡21 小时前
ICCV 2025|从粗到细:用于高效3D高斯溅射的可学习离散小波变换
人工智能·深度学习·学习·3d
limengshi1383921 天前
机器学习面试:请介绍几种常用的学习率衰减方式
人工智能·学习·机器学习
知识分享小能手1 天前
React学习教程,从入门到精通,React 组件核心语法知识点详解(类组件体系)(19)
前端·javascript·vue.js·学习·react.js·react·anti-design-vue
周周记笔记1 天前
学习笔记:第一个Python程序
笔记·学习
丑小鸭是白天鹅1 天前
Kotlin协程详细笔记之切线程和挂起函数
开发语言·笔记·kotlin
潘达斯奈基~1 天前
《大数据之路1》笔记2:数据模型
大数据·笔记