RAG工作流程的执行时机

羽师2026-04-18 16:40

RAG工作流程的执行时机如下：

文档加载和向量存储（前两步）：
- 这部分是在项目启动时或首次创建VectorStoreService实例时处理的
- VectorStoreService类的load_document方法会：
  - 从数据文件夹读取文档
  - 分割成小块
  - 使用嵌入模型将文本转换为向量
  - 存储到向量数据库中
  - 计算文件MD5值进行去重，避免重复加载
用户查询处理（后四步）：
- 这部分是在用户发送请求时处理的
- 当用户提问时，系统会：
  - 将问题转换为向量
  - 在向量空间中检索最相似的文档片段
  - 将检索到的文档作为上下文传递给大语言模型
  - 模型基于上下文生成准确的回答

执行流程：

项目启动时，VectorStoreService会加载数据文件夹中的文档并处理为向量
用户发送查询时，RagSummarizeService会调用检索器获取相关文档
将检索到的文档与用户查询一起传递给模型
模型生成基于上下文的回答

这种设计使得系统在启动时完成了耗时的文档处理工作，而在用户查询时能够快速响应，提高了系统的性能和用户体验。

上一篇：鸿蒙架构师修炼之道-面向对象的分布式架构

下一篇：C++11 新特性万能函数容器之std::function

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 03国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 092026 年 AI 大模型 & AI 编程工具实战全总结 102026开年大模型最新对比解析及场景落地指南