Claude Code / Codex 架构推测 + 可实现版本设计（从0到1复刻一个Agent系统）

一、先说结论：它们的核心不是"模型"，而是一个"Agent运行时系统"

很多人以为：

Claude Code / Codex = 更强的模型

但官方信息已经很明确：

能读代码仓库、改文件、执行命令 (Claude)
能在 sandbox 里执行任务、并行处理多个任务 (OpenAI)

👉 本质已经不是"生成代码"，而是：

一个运行在真实环境中的Agent系统

二、Claude Code / Codex 的真实架构（推测还原）

结合公开信息 + 实际使用体验，可以抽象成👇

text 复制代码

用户输入
   ↓
Agent Runtime（核心系统）
   ↓
Planner（规划）
   ↓
Executor（执行）
   ↓
Environment（环境）
   ↓
Feedback Loop（反馈）
   ↺（循环）

👉 核心一句话：

它们是一个"单Agent循环系统 + 外部环境驱动"的架构

三、核心机制：那个最关键的"Agent Loop"

官方其实已经给出过线索：

text 复制代码

gather context → take action → verify → repeat

(Anthropic)

👉 翻译成人话就是：

text 复制代码

读信息 → 动手做 → 看结果 → 再决定

✔️ 完整循环：

text 复制代码

while not done:
    读取当前状态
    规划下一步
    执行动作
    观察结果
    判断是否成功

👉 回答你最关键的问题：

❓它们有没有：

状态 ✅
规划 ✅
执行 ✅
反馈 ✅
失败重试 ✅

👉 答案：全都有，而且这是核心能力

四、逐层拆解（工程级视角）

1️⃣ Agent Runtime（真正的大脑）

这是最容易被忽略的一层。

👉 它负责：

控制循环（loop）
管理上下文
控制工具调用
控制token成本
管理任务生命周期

👉 本质：

text 复制代码

LLM ≠ Agent
Agent = Runtime + LLM

2️⃣ Planner（规划系统）

Claude Code 有一个非常典型的特征：

👉 会生成 TODO / 计划列表 (PromptLayer)

👉 说明它内部做了：

text 复制代码

任务 → 拆步骤 → 逐步执行

👉 可实现版本（你可以自己做）：

python 复制代码

def plan(task):
    return llm("""
    将任务拆解为步骤列表：
    {}
    """.format(task))

👉 这其实就是：

Plan-and-Execute 模式

3️⃣ Executor（执行系统）

区别普通Agent的关键点👇

❌ 普通Agent：

text 复制代码

call_tool → return

✅ Claude Code / Codex：

text 复制代码

- 读文件
- 写文件
- 执行shell
- 跑测试

👉 即：

操作真实环境（Environment）

👉 官方描述也验证了：

编辑文件
执行命令
(Claude)

👉 可实现版本：

python 复制代码

class Executor:

    def run(action):
        if action.type == "edit_file":
            write_file(action.path, action.content)

        elif action.type == "run_cmd":
            return subprocess.run(action.cmd)

4️⃣ Environment（环境层）🔥核心

这是绝大多数人没意识到的：

👉 Codex：

每个任务运行在 sandbox 环境 (OpenAI)

👉 Claude Code：

直接操作本地 repo + terminal (labs.adaline.ai)

👉 本质：

text 复制代码

Agent不是在"想"
而是在"与环境交互"

👉 这一步带来的质变：

能力	普通LLM	Agent
写代码	✅	✅
运行代码	❌	✅
修Bug	❌	✅
自动迭代	❌	✅

5️⃣ Feedback Loop（最关键）

Claude Code 的行为本质：

text 复制代码

请求工具 → 执行 → 返回结果 → 再判断

(virtuslab.com)

👉 这就是：

text 复制代码

执行 → 观察 → 判断 → 再执行

👉 可实现版本：

python 复制代码

while True:

    action = llm(state)

    result = executor.run(action)

    state.update(result)

    if is_done(state):
        break

👉 这一步，就是：

让模型"用结果修正自己"

五、Claude Code vs Codex 架构差异（重点）

👉 Claude Code（偏"规划型Agent"）

特点：

单循环（single loop） (PromptLayer)
TODO planning
强解释能力

👉 更像：

text 复制代码

一个会思考的工程师

👉 Codex（偏"执行型Agent"）

特点：

多任务并行（parallel tasks） (OpenAI)
sandbox隔离
更偏工程执行

👉 更像：

text 复制代码

一个自动化开发流水线

六、你可以自己实现一个"简化版 Claude Code"

👉 最小架构（可落地）

text 复制代码

1. Agent Loop
2. Planner（LLM）
3. Executor（工具）
4. State Store
5. Environment（本地/容器）

👉 代码骨架：

python 复制代码

class Agent:

    def run(task):

        state = init_state(task)

        while not state.done:

            plan = planner(state)

            action = choose_action(plan)

            result = executor.run(action)

            state.update(result)

        return state.result

七、升级版本（结合你的MCP）

你可以直接升级成：

text 复制代码

Agent → MCP → Tools / Models

👉 MCP负责：

工具抽象
多模型调度
权限控制
fallback

👉 这就是：

工业级Agent架构

八、总结（最关键一句话）

Claude Code / Codex 不是"会写代码的模型"，而是"一个运行在真实环境中的闭环Agent系统"。

九、给你的一个关键启发（非常重要）

如果你想做更强的Agent：

❌ 不要再优化：

prompt
few-shot

✅ 应该优化：

环境（Environment）
状态（State）
循环（Loop）
调度（Orchestration）

👉 因为：

智能不在模型里，而在系统里