一、先说结论:它们的核心不是"模型",而是一个"Agent运行时系统"
很多人以为:
Claude Code / Codex = 更强的模型
但官方信息已经很明确:
👉 本质已经不是"生成代码",而是:
一个运行在真实环境中的Agent系统
二、Claude Code / Codex 的真实架构(推测还原)
结合公开信息 + 实际使用体验,可以抽象成👇
text
用户输入
↓
Agent Runtime(核心系统)
↓
Planner(规划)
↓
Executor(执行)
↓
Environment(环境)
↓
Feedback Loop(反馈)
↺(循环)
👉 核心一句话:
它们是一个"单Agent循环系统 + 外部环境驱动"的架构
三、核心机制:那个最关键的"Agent Loop"
官方其实已经给出过线索:
text
gather context → take action → verify → repeat
👉 翻译成人话就是:
text
读信息 → 动手做 → 看结果 → 再决定
✔️ 完整循环:
text
while not done:
读取当前状态
规划下一步
执行动作
观察结果
判断是否成功
👉 回答你最关键的问题:
❓它们有没有:
- 状态 ✅
- 规划 ✅
- 执行 ✅
- 反馈 ✅
- 失败重试 ✅
👉 答案:全都有,而且这是核心能力
四、逐层拆解(工程级视角)
1️⃣ Agent Runtime(真正的大脑)
这是最容易被忽略的一层。
👉 它负责:
- 控制循环(loop)
- 管理上下文
- 控制工具调用
- 控制token成本
- 管理任务生命周期
👉 本质:
text
LLM ≠ Agent
Agent = Runtime + LLM
2️⃣ Planner(规划系统)
Claude Code 有一个非常典型的特征:
👉 会生成 TODO / 计划列表 (PromptLayer)
👉 说明它内部做了:
text
任务 → 拆步骤 → 逐步执行
👉 可实现版本(你可以自己做):
python
def plan(task):
return llm("""
将任务拆解为步骤列表:
{}
""".format(task))
👉 这其实就是:
Plan-and-Execute 模式
3️⃣ Executor(执行系统)
区别普通Agent的关键点👇
❌ 普通Agent:
text
call_tool → return
✅ Claude Code / Codex:
text
- 读文件
- 写文件
- 执行shell
- 跑测试
👉 即:
操作真实环境(Environment)
👉 官方描述也验证了:
- 编辑文件
- 执行命令
(Claude)
👉 可实现版本:
python
class Executor:
def run(action):
if action.type == "edit_file":
write_file(action.path, action.content)
elif action.type == "run_cmd":
return subprocess.run(action.cmd)
4️⃣ Environment(环境层)🔥核心
这是绝大多数人没意识到的:
👉 Codex:
- 每个任务运行在 sandbox 环境 (OpenAI)
👉 Claude Code:
- 直接操作本地 repo + terminal (labs.adaline.ai)
👉 本质:
text
Agent不是在"想"
而是在"与环境交互"
👉 这一步带来的质变:
| 能力 | 普通LLM | Agent |
|---|---|---|
| 写代码 | ✅ | ✅ |
| 运行代码 | ❌ | ✅ |
| 修Bug | ❌ | ✅ |
| 自动迭代 | ❌ | ✅ |
5️⃣ Feedback Loop(最关键)
Claude Code 的行为本质:
text
请求工具 → 执行 → 返回结果 → 再判断
👉 这就是:
text
执行 → 观察 → 判断 → 再执行
👉 可实现版本:
python
while True:
action = llm(state)
result = executor.run(action)
state.update(result)
if is_done(state):
break
👉 这一步,就是:
让模型"用结果修正自己"
五、Claude Code vs Codex 架构差异(重点)
👉 Claude Code(偏"规划型Agent")
特点:
- 单循环(single loop) (PromptLayer)
- TODO planning
- 强解释能力
👉 更像:
text
一个会思考的工程师
👉 Codex(偏"执行型Agent")
特点:
- 多任务并行(parallel tasks) (OpenAI)
- sandbox隔离
- 更偏工程执行
👉 更像:
text
一个自动化开发流水线
六、你可以自己实现一个"简化版 Claude Code"
👉 最小架构(可落地)
text
1. Agent Loop
2. Planner(LLM)
3. Executor(工具)
4. State Store
5. Environment(本地/容器)
👉 代码骨架:
python
class Agent:
def run(task):
state = init_state(task)
while not state.done:
plan = planner(state)
action = choose_action(plan)
result = executor.run(action)
state.update(result)
return state.result
七、升级版本(结合你的MCP)
你可以直接升级成:
text
Agent → MCP → Tools / Models
👉 MCP负责:
- 工具抽象
- 多模型调度
- 权限控制
- fallback
👉 这就是:
工业级Agent架构
八、总结(最关键一句话)
Claude Code / Codex 不是"会写代码的模型",而是"一个运行在真实环境中的闭环Agent系统"。
九、给你的一个关键启发(非常重要)
如果你想做更强的Agent:
❌ 不要再优化:
- prompt
- few-shot
✅ 应该优化:
- 环境(Environment)
- 状态(State)
- 循环(Loop)
- 调度(Orchestration)
👉 因为:
智能不在模型里,而在系统里