技术栈
记忆机制
ん贤
2 天前
agent
·
rag
·
记忆机制
如何设计Agent的记忆模块
大模型天生就有有记忆缺陷。 就同HTTP请求一般,每次对大模型的请求,都是无状态的。所以为了让大模型拥有记忆,就需要在每次请求里面,携带上他之前说过的话。从而模仿他的记忆,让他知道,自己是谁,为谁服务,服务什么,服务对象又有什么性格等等…
Fzuim
1 个月前
ai
·
架构
·
claude code
·
上下文管理
·
记忆机制
Claude Code v2.1.88 三层「自愈记忆」架构深度解析
基于 Claude Code 源码(通过 sourceMap 还原)逆向分析其上下文管理与记忆系统。Claude Code 的上下文管理是一个 三层渐进式压缩 + 多重自愈恢复 的系统。三层并非平行运行,而是按「代价从低到高」依次升级:
M宝可梦
3 个月前
深度学习
·
架构
·
transformer
·
deepseek
·
记忆机制
新一代Transformer 架构MAT: Engram-STEM-PLE
本文介绍一篇与DeepSeek颇有渊源的一片工作,来自meta; 同样使用了embedding table 来存储词向量,在FFN层作为改进,进行memory 注入;
我是有底线的