RAG工作流程的执行时机

RAG工作流程的执行时机如下:

  1. 文档加载和向量存储(前两步):

    • 这部分是在项目启动时或首次创建VectorStoreService实例时处理的
    • VectorStoreService类的load_document方法会:
      • 从数据文件夹读取文档
      • 分割成小块
      • 使用嵌入模型将文本转换为向量
      • 存储到向量数据库中
      • 计算文件MD5值进行去重,避免重复加载
  2. 用户查询处理(后四步):

    • 这部分是在用户发送请求时处理的
    • 当用户提问时,系统会:
      • 将问题转换为向量
      • 在向量空间中检索最相似的文档片段
      • 将检索到的文档作为上下文传递给大语言模型
      • 模型基于上下文生成准确的回答

执行流程

  1. 项目启动时,VectorStoreService会加载数据文件夹中的文档并处理为向量
  2. 用户发送查询时,RagSummarizeService会调用检索器获取相关文档
  3. 将检索到的文档与用户查询一起传递给模型
  4. 模型生成基于上下文的回答

这种设计使得系统在启动时完成了耗时的文档处理工作,而在用户查询时能够快速响应,提高了系统的性能和用户体验。

相关推荐
火山引擎开发者社区1 小时前
告别长期密码:火山引擎云数据库 MySQL IAM 鉴权全解析
人工智能
火山引擎开发者社区1 小时前
从仓库维护者到架构师|首个大规模真实仓库长程任务 SWE 数据集 DeNovoSWE 发布,火山引擎云沙箱提供支撑
人工智能
火山引擎开发者社区7 小时前
火山 DTS 正式支持 MySQL 同步到 Milvus , 解决业务库到向量库最后一公里
人工智能
火山引擎开发者社区8 小时前
@开发者,提前解锁 FORCE 原动力大会五大看点,限时赢取门票福利
人工智能
火山引擎开发者社区8 小时前
这个 Skill 让 Agent 从会理解到会执行,补齐移动 APP 执行最后一公里
人工智能
火山引擎开发者社区12 小时前
Agent Plan、Coding Plan限时优惠:2.5折畅享多模型!
人工智能
冬奇Lab12 小时前
AI Workflow 定义的四次演进:从 Markdown 到 JS 脚本,再到分布式多 Agent
javascript·人工智能·agent
冬奇Lab12 小时前
每日一个开源项目(第136篇):OpenMemory - 给 AI Agent 真正的认知记忆引擎
人工智能
黄啊码13 小时前
【黄啊码】微信 AI 把聊天功能和 Vibe Coding打通了,创业者:我又白干了
人工智能