
如上图所示,假如我们要参加临时考试,那我们有三种途径获取答案,1、直接查询数据 2、利用检索系统查询 3、LLM知识检索增强生成。第一种方法直接查询数据,这也是最笨拙的方法,第二种方法则是利用检索系统查询,我们需要构建很多 query-answer对,来方便我们快速检索答案,第三种则是RAG,结合大模型来快速生成答案。
图中RAG流程实现过程:
1.将外部知识库的资料,读取进行切片划分,然后再Embeding,转换成向量的形式进行存储,也就是存储在图中的vectordb中,当我们再输出query的时候,会将query也转换成vector,然后再进行相似度等方法计算,最后再进行Augmented,然后输入到LLM中,然后输出最终的大模型Generation的答案。
下图就是langchain存储外部知识库的一系列流程:

参考链接:链接