rag学习笔记

目录

rag原理:

[RAG 的核心原理分步解析](#RAG 的核心原理分步解析)

[1. 用户提问(Query)](#1. 用户提问(Query))

[2. 检索(Retrieval)](#2. 检索(Retrieval))

[3. 增强提示(Augmented Prompt)](#3. 增强提示(Augmented Prompt))

[4. 生成(Generation)](#4. 生成(Generation))

[5. 输出最终答案](#5. 输出最终答案)

扩展:高级RAG技术


rag原理:

一文带你速通RAG、知识库和LLM!_rag知识库-CSDN博客

RAG(Retrieval-Augmented Generation,检索增强生成)是一种将信息检索文本生成 相结合的技术,旨在提升大语言模型(LLM)生成内容的准确性、时效性和事实性。其核心原理是通过实时检索外部知识源来补充LLM的内部知识,从而生成更可靠的回答。

RAG 的核心原理分步解析

以下是RAG工作流程的详细拆解:

1. 用户提问(Query)
  • 用户输入一个问题或指令(例如:"量子计算的最新突破有哪些?")。
2. 检索(Retrieval)
  • 语义检索 :将用户问题转化为向量(Embedding),在向量数据库中搜索语义相似的文档片段。

  • 知识来源:数据库可包含PDF、网页、企业文档、研究论文等结构化/非结构化数据。

  • 返回结果:系统返回Top-K个最相关的文本片段(例如:3-5个相关段落)。

3. 增强提示(Augmented Prompt)
  • 将检索到的文本片段与用户问题拼接,形成新的提示词(Prompt):

    复制代码
    根据以下信息回答问题:
    [检索到的文本片段1]
    [片段2]
    ...
    问题:{用户原始提问}
  • 示例提示:

    上下文:2024年IBM发布了量子处理器"Heron",错误率降低至...

    问题:量子计算的最新突破有哪些?

4. 生成(Generation)
  • LLM基于增强后的提示生成回答:

    • 模型会优先依赖检索到的权威信息,而非仅凭训练数据中的记忆。

    • 生成结果通常包含引用来源(如:"根据IBM 2024年的报告...")。

5. 输出最终答案
  • 生成融合了检索信息的自然语言回复,并确保关键事实与检索内容一致。

扩展:高级RAG技术

  • HyDE:先让LLM生成假设答案,再用其Embedding检索更相关文档。

  • 递归检索:对检索结果进一步检索,实现多跳推理。

  • 重排序(Re-Rank):用更精细的模型对检索结果二次排序。

相关推荐
心中有国也有家21 分钟前
cann-recipes-infer:昇腾 NPU 推理的“菜谱集合”
经验分享·笔记·学习·算法
玄米乌龙茶12327 分钟前
LLM成长笔记(三):API 开发基础
笔记
Upsy-Daisy28 分钟前
AI Agent 项目学习笔记(八):Tool Calling 工具调用机制总览
人工智能·笔记·学习
LuminousCPP2 小时前
数据结构 - 线性表第四篇:C 语言通讯录优化升级全记录(踩坑 + 思考)
c语言·开发语言·数据结构·经验分享·笔记·学习
魔法阵维护师2 小时前
从零开发游戏需要学习的c#模块,第十四章(保存和加载)
学习·游戏·c#
_李小白3 小时前
【android opencv学习笔记】Day 17: 目标追踪(MeanShift)
android·opencv·学习
一只机电自动化菜鸟3 小时前
一建机电备考笔记(40) 建筑机电施工—排水管道施工(含考频+题型)
经验分享·笔记·学习·职场和发展·课程设计
2301_818730563 小时前
numpy的学习(笔记)
学习·numpy
你干嘛?哎哟3 小时前
4月工作笔记
笔记
tom02184 小时前
软考中级《嵌入式系统设计师》全套备考资料(真题 + 教材 + 笔记)
笔记·嵌入式·软考·自学·电子技术·电子资料·变成