小白的RAG缓存

RAG流程:

  1. 用户提问(q

  2. q做处理(重写 \ 查询扩展 \ 向量化)

  3. 向量库检索(向量相似度匹配)

  4. q+选出的文档片段组合成prompt

  5. 调用大模型回答a

1.完整问答缓存(qa cache

将每个q标准化以后,与对应的a做匹配后存入缓存,当用户再问同样的问题后直接返回与其对应的a

key : q问题(标准化后的问题)

value :模型返回的答案

2. 近似问题缓存

3. 检索结果缓存

相关推荐
洞窝技术16 小时前
为什么 RAG 越来越少被提及了?深入聊聊 AI Agent 时代的技术演进逻辑
aigc
刘棕霆16 小时前
24—AI Skill 测评工作流工具箱化:为什么 regression 会自然出现
aigc·ai编程·测试
threerocks18 小时前
神级 Skill,作品个个儿爆,我开源了长期自用的手绘风格库
人工智能·aigc
leeyi19 小时前
Callback 系统:给 Agent 管道装上“监听器“
aigc·agent·ai编程
赫媒派19 小时前
OpenClaw 3 个提效设置实战:自动快模式、自适应思考、定时工作流
aigc
深蓝AI19 小时前
MCP 协议拆解:Claude Code 的工具调用背后发生了什么?
aigc
kfaino20 小时前
码农的AI翻身(六)你好,我叫 Parameter
后端·aigc
用户6369790981431 天前
AI Skill构建的十个层次:从提示词到业务闭环
aigc
怕浪猫1 天前
第6章 多智能体协作:从单兵作战到群体智能
aigc·openai·ai编程
doiito1 天前
【Agent Harness】Gliding Horse 的 L2 作战地图:让多 Agent 协作从“摸黑”变成“透明”
ai·rust·架构设计·系统设计·ai agent