RAG实现大致流程

sauTCc2025-02-22 11:58

如上图所示，假如我们要参加临时考试，那我们有三种途径获取答案，1、直接查询数据 2、利用检索系统查询 3、LLM知识检索增强生成。第一种方法直接查询数据，这也是最笨拙的方法，第二种方法则是利用检索系统查询，我们需要构建很多 query-answer对，来方便我们快速检索答案，第三种则是RAG，结合大模型来快速生成答案。

图中RAG流程实现过程：

1.将外部知识库的资料，读取进行切片划分，然后再Embeding，转换成向量的形式进行存储，也就是存储在图中的vectordb中，当我们再输出query的时候，会将query也转换成vector，然后再进行相似度等方法计算，最后再进行Augmented，然后输入到LLM中，然后输出最终的大模型Generation的答案。

下图就是langchain存储外部知识库的一系列流程：

参考链接：链接