小白的RAG缓存

RAG流程:

  1. 用户提问(q

  2. q做处理(重写 \ 查询扩展 \ 向量化)

  3. 向量库检索(向量相似度匹配)

  4. q+选出的文档片段组合成prompt

  5. 调用大模型回答a

1.完整问答缓存(qa cache

将每个q标准化以后,与对应的a做匹配后存入缓存,当用户再问同样的问题后直接返回与其对应的a

key : q问题(标准化后的问题)

value :模型返回的答案

2. 近似问题缓存

3. 检索结果缓存

相关推荐
程序员鱼皮16 小时前
我用 DeepSeek V4 + Claude Code 开发了个「提肛助手」,这波给我爽麻了。。。
ai·程序员·编程·ai编程·deepseek
Huang26010817 小时前
Producer Audios Generation API 集成指南
ai
却尘17 小时前
Codex CLI 的 config.toml 比你想象的能玩:六层优先级、信任沙箱、还有一堆官方默默打开的好东西
aigc·openai·ai编程
ykjhr_3d17 小时前
数字工具AI智能学伴,助力教育数字化转型
大数据·人工智能·ai·ai人工智能·华锐视点·华锐云空间
LIUAWEIO17 小时前
鸽鸽工具网:免费在线工具大全,打开网页即用
人工智能·安全·ai·json
饭后一颗花生米17 小时前
养马养虾助手免费下载免费安装教程,一键部署永久使用
ai
imbackneverdie17 小时前
AI生成论文插图速度快不用手搓,但是怎么变成矢量图?
图像处理·人工智能·ai作画·aigc·科研绘图·ai工具·ai生图
92year17 小时前
用 Python 从零实现 LLM 多模型熔断降级——asyncio + 自动切换实战
aigc
维元码簿17 小时前
Claude Code 深度拆解:Agent 执行内核 2 — Pipeline 与上下文压缩
ai·agent·claude code·ai coding