RAG检索增强生成（Retrieval Augmented Generation）

大模型知识的局限性。

RAG就是通过检索获取相关的知识并将其融入Prompt，让大模型能够参考相应的知识从而给出合理回答。

索引： 搭建一个知识库，支撑后面的文档索引核心：怎么切割知识，怎么选择合适的模型

检索： 找到合适的参考文档，核心：检索方式选择

生成： 整合提问和参考文档输入大模型，得到答案核心：提示词构建和大模型选择

文档切分：核心语义连贯性

切分方法：

最好的问题答案对，知识归

检索用：小文本块，生成时：大文本块

语义检索和关键字检索关系

提问改写：

用户：三国里战力最高的是谁

RAG系统：是吕布

用户：他是哪一年出生的？

拆解成多个问题，分别提问RAG，然后组合成最终答案

如何很好的利用参考文档

1、简单粗暴，都丢给大模型

准确率：用户视角，答案是否符合预期

忠诚度：生成的内容是否忠实于提供的上下文或背景信息

召回率，精确率，F1：评估找的资料质量

评估手段：

知识库建立：对JAPI文档做摘要总结入口

问题优化：问题改写拓展

文档检索：采用多路召回的方式关键字+向量数据库检索

结果返回：文档去重后，大模型算相似度排序 + 总结回答

稠密向量，稀疏向量

余弦相似度语义识别好

欧氏距离具体+关键词