React Query 缓存 AI 对话历史的几个权衡

之前对话历史我是自己写了一坨 state + useEffect 管的,加载、缓存、失效全手撸,代码越滚越乱。后来用 React Query(TanStack Query)接管,清爽不少。但 AI 对话这种场景跟普通列表不太一样,套缓存有几个要想清楚的取舍,聊聊。

历史列表用 useQuery 很顺

会话列表、某个会话的历史消息,都是典型的服务端状态,useQuery 一把:

php 复制代码
const { data: messages } = useQuery({
  queryKey: ['chat', sessionId],
  queryFn: () => fetchMessages(sessionId),
  staleTime: 5 * 60 * 1000, // 5 分钟内不重新拉
})

切会话再切回来,有缓存秒出,不用转圈,这点体验提升很明显。

麻烦在于:流式新消息怎么塞进缓存

这是最别扭的地方。AI 新回的消息是流式一点点来的,不是一个请求返回的整块数据,套不进 queryFn 那套。我的做法是:流式过程中用本地 state 管那条"正在生成"的消息,生成完了再用 setQueryData 手动把它合并进缓存:

ini 复制代码
queryClient.setQueryData(['chat', sessionId], old =>
  [...old, finishedMessage])

等于流式期间走本地 state,落定后才进 Query 缓存。两套状态并存,得小心别让它们打架------我就出过新消息在缓存里出现两次的 bug,因为生成完合并了一次、下次拉历史后端又返回了一次。

staleTime 别设太短

对话历史不像股价,不需要频繁刷新。我一开始没设 staleTime,默认是 0,结果每次切回会话都重新拉一遍,白白请求。设成几分钟甚至更长都行,历史消息又不会自己变。

乐观更新让发送不卡

用户发的消息,用 onMutate 先乐观塞进缓存,UI 立刻显示"我"的气泡,不用等请求回来。失败了再 onError 回滚。发消息这步体感能从"点一下等半秒"变成"秒出"。

一个没理顺的

queryKey 我用 sessionId 做 key,但分页历史(往上翻旧消息)我用了 useInfiniteQuery,跟流式新消息的合并逻辑搅在一起,代码读起来挺绕。这块结构我还想再重构,目前能跑但不算优雅。

模型这层我直接调讯飞 MaaS,现成 API 不用自建算力,前端就专心把这套缓存逻辑磨顺。你们用 Query 管 AI 对话有啥心得,评论区交流。

相关推荐
米小虾1 小时前
2026半年盘点:AI界发生的6件大事,正在彻底改变产业格局
人工智能
道友可好3 小时前
让 AI 自己验收,等于让学生自己批卷
前端·人工智能·后端
美团技术团队4 小时前
美团海报生成 AIGC 技术创新与实践
人工智能
冬哥聊AI4 小时前
放弃 Spring AI?这 3 个开源框架,才是让 SpringBoot 玩转 AI Agent 的正解
人工智能
小爷毛毛_卓寿杰4 小时前
当 max_tokens=1 遇上 reasoning 模型:从 Xagent 一次“测试连接“按钮的失败说起
人工智能
用户5191495848454 小时前
Flex QR Code Generator 漏洞利用工具 CVE-2025-10041
人工智能·aigc
蝎子莱莱爱打怪5 小时前
AI Agent 相关知识扫盲:16 个概念+11张图+38个开源项目推荐
人工智能·github·agent