
一、Agent 核心定义
Agent 是感知、记忆、推理、行动 融合的数字智能体,人机关系从Copilot(人主导)升级为Autopilot(AI 主导 + 人监督),需预留 HITL 接口保障人类主体性。
二、心智架构总览
Agent 抛弃传统线性输入 - 输出,采用感知 - 推理 - 行动无限循环,是持续运行的 "进程" 而非单次 "函数"。
- 感知:上下文映射,获取并理解世界
- 推理:任务拆解、思维链决策
- 行动:工具调用,改变环境并获得反馈
- 循环:反馈驱动迭代,螺旋式进化
三、感知:主动过滤器(核心 = 过滤 + 理解)
- 三大机制
- 注意力:筛选关键信息,过滤噪声,聚焦任务
- 预测:基于历史预判,捕捉偏离的 "惊奇点"
- 语义化:从识别 "是什么" 到理解 "意味着什么"
- 特点:主动获取、多模态兼容(文本 / 视觉 / 听觉)、目标驱动。
四、推理:双系统思考(快 + 慢)
- 双系统模型
- System1(快思考 / 直觉):自动响应、低成本,适用于简单任务,易幻觉
- System2(慢思考 / 分析):思维链推理、高可靠,适用于复杂规划与调试
- 推理四层次
- 情境理解→经验检索→心智模拟→决策与信心评估
- 高级能力:因果推理、反事实思考、不确定性量化。
五、行动:改变世界 + 反馈闭环
- 三大行动维度
- 认识性行动:以行动探路,消除不确定性(行动 = 实验)
- 目的性行动:主动产生可控副作用(改数据、发邮件、部署代码)
- 闭环行动:执行→验证→纠偏,形成反馈循环
- 核心范式 :ReAct = 思考→行动→观察,持续试错修正。
六、循环动力学:OODA 软件化
- OODA 循环
- Observe(观察)→Orient(定位 / 更新世界模型)→Decide(决策)→Act(行动)
- 核心价值
- 认知螺旋:每轮循环更新认知,持续进化
- 符号接地:用现实反馈减少 LLM 幻觉
- 时间连续性:累积记忆,形成身份感
- 实现方式:状态机驱动引擎,而非简单死循环。
七、循环涌现的四大灵魂特质
- 信念:世界模型的累积与验证
- 目标:动态优先级队列,随情境演化
- 情绪:System1 调节阀,应对不确定性
- 元认知:对思考的思考,自我优化
八、具身认知:数字身体塑造智能
- 数字 "身体" 约束
- 上下文窗口 = 感知容量
- 推理延迟 = 反应速度
- Token 成本 = 代谢能量
- 约束催生智能:有限资源倒逼抽象、规划、启发式策略
- 核心结论 :身体不是容器,是心智的模具。
九、核心哲学总结
- 存在即循环:循环终止,智能消失
- 认知即预测:误差驱动学习
- 智能即适应:闭环实现自主与进化