RAG实现大致流程

如上图所示,假如我们要参加临时考试,那我们有三种途径获取答案,1、直接查询数据 2、利用检索系统查询 3、LLM知识检索增强生成。第一种方法直接查询数据,这也是最笨拙的方法,第二种方法则是利用检索系统查询,我们需要构建很多 query-answer对,来方便我们快速检索答案,第三种则是RAG,结合大模型来快速生成答案。

图中RAG流程实现过程:

1.将外部知识库的资料,读取进行切片划分,然后再Embeding,转换成向量的形式进行存储,也就是存储在图中的vectordb中,当我们再输出query的时候,会将query也转换成vector,然后再进行相似度等方法计算,最后再进行Augmented,然后输入到LLM中,然后输出最终的大模型Generation的答案。

下图就是langchain存储外部知识库的一系列流程:

参考链接:链接

相关推荐
curemoon7 分钟前
理解都远正态分布中指数项的精度矩阵(协方差逆矩阵)
人工智能·算法·矩阵
胡桃不是夹子1 小时前
CPU安装pytorch(别点进来)
人工智能·pytorch·python
Fansv5871 小时前
深度学习-6.用于计算机视觉的深度学习
人工智能·深度学习·计算机视觉
xjxijd1 小时前
AI 为金融领域带来了什么突破?
人工智能·其他
SKYDROID云卓小助手2 小时前
无人设备遥控器之如何分享数传篇
网络·人工智能·算法·计算机视觉·电脑
deephub2 小时前
LLM高效推理:KV缓存与分页注意力机制深度解析
人工智能·深度学习·语言模型
奋斗的袍子0072 小时前
Spring AI + Ollama 实现调用DeepSeek-R1模型API
人工智能·spring boot·深度学习·spring·springai·deepseek
青衫弦语2 小时前
【论文精读】VLM-AD:通过视觉-语言模型监督实现端到端自动驾驶
人工智能·深度学习·语言模型·自然语言处理·自动驾驶
没枕头我咋睡觉2 小时前
【大语言模型_4】源码编译vllm框架cpu版
人工智能·语言模型·自然语言处理
视觉语言导航2 小时前
NeurIPS-2024 | 具身智能如何理解空间关系?SpatialRGPT:视觉语言模型中的具象空间推理
人工智能·具身智能