技术栈
推理成本
小七-七牛开发者
2 小时前
缓存
·
agent
·
token
·
context
·
上下文
·
推理成本
TokenPilot:让 LLM Agent 长会话成本降 60%+ 的上下文管理
今天解读的这篇论文叫 TokenPilot: Cache-Efficient Context Management for LLM Agents,作者来自浙江大学、电子科技大学、西安电子科技大学和 HomologyAI。
我是有底线的