技术栈

prompt caching

前端摸鱼匠
10 天前
ai agent·prompt caching·llm 优化,工具集设计
提示词缓存命中率翻倍,面向缓存设计你的工具集很多资深工程师在构建 AI Agent 时,都经历过这样的困惑:明明代码逻辑没变,工具也还是那些工具,但随着会话进行,Token 消耗却像滚雪球一样失控,响应速度也越来越慢。我们习惯性地认为这是模型变“笨”了,或者是上下文太长导致的,于是拼命优化 RAG、压缩历史对话,却往往收效甚微。
阿杰学AI
4 个月前
人工智能·ai·语言模型·自然语言处理·aigc·prompt caching·提示词缓存
AI核心知识71——大语言模型之Prompt Caching (简洁且通俗易懂版)Prompt Caching (提示词缓存) 是 2024 年下半年开始在各大模型厂商(如 Anthropic, Google, DeepSeek)中普及的一项“降本增效”黑科技 。
我是有底线的