小白的RAG缓存

num_killer2026-01-08 8:46

RAG流程：

用户提问（q）
对q做处理（重写 \ 查询扩展 \ 向量化）
向量库检索（向量相似度匹配）
将q+选出的文档片段组合成prompt
调用大模型回答a

1.完整问答缓存（`q` → `a` `cache`）

将每个q标准化以后，与对应的a做匹配后存入缓存，当用户再问同样的问题后直接返回与其对应的a

key : q问题（标准化后的问题）

value ：模型返回的答案

2. 近似问题缓存

3. 检索结果缓存

上一篇：NAT模式、路由模式、桥接模式区别对比

下一篇：企业视频私域做企业内训、企业课程平台

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 年 AI 大模型 & AI 编程工具实战全总结 092026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？10微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新