小白的RAG缓存

RAG流程:

  1. 用户提问(q

  2. q做处理(重写 \ 查询扩展 \ 向量化)

  3. 向量库检索(向量相似度匹配)

  4. q+选出的文档片段组合成prompt

  5. 调用大模型回答a

1.完整问答缓存(qa cache

将每个q标准化以后,与对应的a做匹配后存入缓存,当用户再问同样的问题后直接返回与其对应的a

key : q问题(标准化后的问题)

value :模型返回的答案

2. 近似问题缓存

3. 检索结果缓存

相关推荐
努力也学不会java32 分钟前
【缓存算法】一篇文章带你彻底搞懂面试高频题LRU/LFU
java·数据结构·人工智能·算法·缓存·面试
GJGCY3 小时前
中小企业财务AI工具技术评测:四大类别架构差异与选型维度
大数据·人工智能·ai·架构·财务·智能体
曦和4 小时前
OpenClaw+CC Switch:小白也能配置好的小龙虾(2026最新)
aigc·ai编程
菜鸟分享录4 小时前
OpenClaw 公网访问难题?一招解决 “control ui requires device identity“ 报错
ai·openclaw·小龙虾
赵康4 小时前
老板与员工:5分钟理解 Subagent 架构
ai·claude code·subagent·openclaw
JavaGuide4 小时前
MiniMax M2.7 发布!Redis 故障排查 + 跨语言重构场景实测,表现如何?
redis·后端·ai·ai编程
AI-Ming4 小时前
注意力机制
算法·ai·ai编程
香吧香5 小时前
Claude Code Token 收费估算
ai
码路飞5 小时前
体验完阿里「悟空」之后,我花 2 小时用 Python 撸了个 AI Agent 🔥
python·aigc
weiwuxian5 小时前
别再拿 Demo 糊弄老板了:企业级 RAG 架构的“填坑”指南 🚀
aigc