02自进化 Agent 的整体架构

经验到底从哪里来?又如何变成能力?

这就是自进化 Agent 架构存在的意义。

很多人做 Agent 时只有:

复制代码
用户
 ↓
LLM
 ↓
工具

结果就是:

复制代码
任务做完
经验丢失
下次重新开始

永远不会成长。

真正的自进化 Agent 应该形成一个完整闭环。


1. 整体架构图

复制代码
                ┌─────────────┐
                │    User     │
                └──────┬──────┘
                       │
                       ▼
                ┌─────────────┐
                │   Planner   │
                └──────┬──────┘
                       │
                       ▼
                ┌─────────────┐
                │  Executor   │
                └──────┬──────┘
                       │
                       ▼
                ┌─────────────┐
                │  Observer   │
                └──────┬──────┘
                       │
                       ▼
                ┌─────────────┐
                │ Evaluator   │
                └──────┬──────┘
                       │
                       ▼
                ┌─────────────┐
                │ Reflector   │
                └──────┬──────┘
                       │
                       ▼
                ┌─────────────┐
                │   Memory    │
                └──────┬──────┘
                       │
                       ▼
                ┌─────────────┐
                │   Policy    │
                └─────────────┘

这 7 个模块构成整个自进化系统。


2. Planner(任务规划器)

Planner 的职责:

复制代码
理解目标
拆解步骤
决定执行顺序
选择工具

例如:

用户:

复制代码
帮我分析这个 GitHub 项目

Planner 不应该直接开始执行。

而是先拆解:

复制代码
步骤1:读取 README

步骤2:分析目录结构

步骤3:识别技术栈

步骤4:检查架构设计

步骤5:生成分析报告

输出:

复制代码
{
  "goal":"分析项目",
  "steps":[
    "读取README",
    "分析目录",
    "识别技术栈",
    "架构评估",
    "输出报告"
  ]
}

Planner 相当于 Agent 的大脑。


3. Executor(执行器)

Executor 负责真正干活。

例如:

复制代码
读取文件
运行命令
调用浏览器
访问 API
修改代码

举例:

Planner:

复制代码
读取 README

Executor:

复制代码
tool.read_file("README.md")

Planner:

复制代码
搜索官方文档

Executor:

复制代码
tool.search()

Planner:

复制代码
运行测试

Executor:

复制代码
tool.shell("npm test")

职责非常单一:

复制代码
只执行
不思考

4. Observer(观察器)

这是很多 Agent 缺失的一层。

作用:

记录 Agent 的全部行为。

例如:

复制代码
什么时候执行
调用什么工具
输入是什么
输出是什么
是否报错
耗时多少

任务日志:

复制代码
{
  "step":"读取README",
  "tool":"read_file",
  "input":"README.md",
  "output":"项目介绍",
  "duration":"300ms",
  "status":"success"
}

又比如:

复制代码
{
  "step":"运行测试",
  "tool":"shell",
  "command":"npm test",
  "error":"Module not found",
  "status":"failed"
}

没有 Observer:

复制代码
Agent 什么都记不住

有 Observer:

复制代码
Agent 可以回放整个过程

这是后面反思的基础。


5. Evaluator(评估器)

评估器回答一个问题:

这次任务做得怎么样?

例如:

成功?

复制代码
成功
失败
部分成功

质量?

复制代码
80分
90分
95分

用户满意?

复制代码
满意
一般
不满意

例如:

用户:

复制代码
帮我写公众号文章

生成后:

复制代码
阅读性:92
结构:95
情绪张力:60
标题吸引力:70

Evaluator 输出:

复制代码
{
  "score":79,
  "issues":[
    "标题吸引力不足",
    "情绪冲击力偏弱"
  ]
}

6. Reflector(反思器)

这是整个系统最核心的部分。

作用:

从经验中学习。

例如:

任务失败:

复制代码
网页打不开

Reflector:

复制代码
失败原因:
目标网站存在反爬机制

解决方案:
优先使用 Browser Agent
不要直接 HTTP 请求

再例如:

用户反馈:

复制代码
文章太像 AI 写的

Reflector:

复制代码
经验:

该用户偏好:
- 口语化
- 强钩子
- 多案例
- 少总结

输出:

复制代码
{
  "lesson":"该用户不喜欢官方风格",
  "future_action":"以后采用公众号爆文风格"
}

7. Memory(长期记忆)

Reflector 产生经验。

Memory 负责保存经验。

例如:

复制代码
用户偏好
工具经验
项目上下文
成功案例
失败案例

存储后:

复制代码
以后都能检索

例如:

用户:

复制代码
帮我设计 UI

Memory:

复制代码
该用户偏好:
- 极简风
- 不喜欢复杂布局
- 不喜欢蓝色绿色

下次自动注入。


8. Policy(策略层)

Policy 是最高层。

负责管理:

复制代码
工作流
规则
Prompt
工具优先级

例如:

策略更新前:

复制代码
搜索
 ↓
生成答案

策略更新后:

复制代码
搜索
 ↓
交叉验证
 ↓
生成答案

又例如:

以前:

复制代码
优先使用 Bing

后来发现:

复制代码
Tavily 更准确

Policy:

复制代码
搜索优先级:

1 Tavily
2 Exa
3 Bing

这就完成了一次进化。


9. 为什么必须拆成 7 个模块?

因为职责不同。

如果全部塞进一个 Prompt:

复制代码
规划
执行
记录
评估
反思
记忆
策略

最后会变成:

复制代码
巨型 Prompt
无法维护
无法测试
无法升级

而拆分后:

复制代码
Planner
Executor
Observer
Evaluator
Reflector
Memory
Policy

每个模块都可以独立升级。


本章总结

一个真正的自进化 Agent,本质上不是一个模型,而是一条学习流水线:

复制代码
用户任务
    ↓
Planner
    ↓
Executor
    ↓
Observer
    ↓
Evaluator
    ↓
Reflector
    ↓
Memory
    ↓
Policy
    ↓
下一次任务

这条链路形成之后,Agent 才开始拥有持续成长的能力。

本章验收标准

读完本章后,读者应该能说清楚:

复制代码
Planner、Executor、Observer、Evaluator、Reflector、Memory、Policy 各自负责什么
为什么自进化 Agent 需要闭环
经验如何从任务过程转化为下一次行为

关键设计决策

本章采用 7 模块架构:

复制代码
规划、执行、观察、评估、反思、记忆、策略分离
每个模块独立演进
不要把所有能力塞进一个巨型 Prompt
相关推荐
TCW11211 小时前
AI底层系列:用C++实现线性代数的公式推导与算法设计-基础篇-5.矩阵方程
人工智能·线性代数·算法
一生了无挂1 小时前
深度解析Token、RAG与Agent的层级逻辑、协作关系及落地价值
大数据·人工智能
智讯天下1 小时前
155颗芯片“把脉“ AI中医体检暖人心 智赋岐黄携AI四诊仪走进天星医药开展公益健康服务
人工智能
叫我:松哥1 小时前
基于机器学习和flask的体育健身风险智能分析系统,系统集成DeepSeek、聚类算法、分类算法等,准确率达90%
人工智能·python·神经网络·算法·机器学习·flask·聚类
SEO_juper1 小时前
Semrush Site Audit 全站体检:自动出完整报告 + AI 逐条解析报错,附带批量整改落地方案
人工智能·seo·外贸·geo·独立站·跨境电商独立站·gsc
常州晟凯电子科技1 小时前
君正T32/T33开发笔记之快启系统演示程序编译和运行
人工智能·笔记·嵌入式硬件·物联网
向量引擎1 小时前
AI API 正在进入“请求生命周期治理”阶段:从模型迁移、Agent 接入到成本与安全排错的工程化方法
java·人工智能·python·aigc·ai编程·ai写作·gpu算力
安逸sgr1 小时前
《图解机器学习-第一章》:机器学习到底是什么?
人工智能·机器学习
BigerBang1 小时前
信息图生成教程
人工智能·信息可视化