rag学习笔记

目录

rag原理:

[RAG 的核心原理分步解析](#RAG 的核心原理分步解析)

[1. 用户提问(Query)](#1. 用户提问(Query))

[2. 检索(Retrieval)](#2. 检索(Retrieval))

[3. 增强提示(Augmented Prompt)](#3. 增强提示(Augmented Prompt))

[4. 生成(Generation)](#4. 生成(Generation))

[5. 输出最终答案](#5. 输出最终答案)

扩展:高级RAG技术


rag原理:

一文带你速通RAG、知识库和LLM!_rag知识库-CSDN博客

RAG(Retrieval-Augmented Generation,检索增强生成)是一种将信息检索文本生成 相结合的技术,旨在提升大语言模型(LLM)生成内容的准确性、时效性和事实性。其核心原理是通过实时检索外部知识源来补充LLM的内部知识,从而生成更可靠的回答。

RAG 的核心原理分步解析

以下是RAG工作流程的详细拆解:

1. 用户提问(Query)
  • 用户输入一个问题或指令(例如:"量子计算的最新突破有哪些?")。
2. 检索(Retrieval)
  • 语义检索 :将用户问题转化为向量(Embedding),在向量数据库中搜索语义相似的文档片段。

  • 知识来源:数据库可包含PDF、网页、企业文档、研究论文等结构化/非结构化数据。

  • 返回结果:系统返回Top-K个最相关的文本片段(例如:3-5个相关段落)。

3. 增强提示(Augmented Prompt)
  • 将检索到的文本片段与用户问题拼接,形成新的提示词(Prompt):

    复制代码
    根据以下信息回答问题:
    [检索到的文本片段1]
    [片段2]
    ...
    问题:{用户原始提问}
  • 示例提示:

    上下文:2024年IBM发布了量子处理器"Heron",错误率降低至...

    问题:量子计算的最新突破有哪些?

4. 生成(Generation)
  • LLM基于增强后的提示生成回答:

    • 模型会优先依赖检索到的权威信息,而非仅凭训练数据中的记忆。

    • 生成结果通常包含引用来源(如:"根据IBM 2024年的报告...")。

5. 输出最终答案
  • 生成融合了检索信息的自然语言回复,并确保关键事实与检索内容一致。

扩展:高级RAG技术

  • HyDE:先让LLM生成假设答案,再用其Embedding检索更相关文档。

  • 递归检索:对检索结果进一步检索,实现多跳推理。

  • 重排序(Re-Rank):用更精细的模型对检索结果二次排序。

相关推荐
微露清风几秒前
系统性学习C++-第十讲-stack 和 quene
java·c++·学习
PyAIGCMaster2 分钟前
钉钉的设计理念方面,我可以学习
人工智能·深度学习·学习·钉钉
Elias不吃糖20 分钟前
第四天学习总结:C++ 文件系统 × Linux 自动化 × Makefile 工程化
linux·c++·学习
CodeCraft Studio31 分钟前
PPT处理控件Aspose.Slides教程:使用Java将PowerPoint笔记导出为PDF
java·笔记·pdf·powerpoint·aspose·ppt转pdf·java将ppt导出pdf
雍凉明月夜41 分钟前
人工智能学习中深度学习之python基础之 类
python·学习
王同学要变强1 小时前
【深入学习Vue丨第二篇】构建动态Web应用的基础
前端·vue.js·学习
好奇龙猫1 小时前
日语学习-日语知识点小记-构建基础-JLPT-N3阶段-二阶段(14):文法和单词-第三课
学习
仰望—星空1 小时前
MiniEngine学习笔记 : DescriptorHeap
windows·笔记·学习
武昌库里写JAVA1 小时前
element-ui 2.x 及 vxe-table 2.x 使用 css 定制主题
java·vue.js·spring boot·sql·学习
YangYang9YangYan2 小时前
高职大数据技术专业学习与发展指南
大数据·人工智能·学习·数据分析