Claude Code / Codex 架构推测 + 可实现版本设计(从0到1复刻一个Agent系统)

一、先说结论:它们的核心不是"模型",而是一个"Agent运行时系统"

很多人以为:

Claude Code / Codex = 更强的模型

但官方信息已经很明确:

  • 能读代码仓库、改文件、执行命令 (Claude)
  • 能在 sandbox 里执行任务、并行处理多个任务 (OpenAI)

👉 本质已经不是"生成代码",而是:

一个运行在真实环境中的Agent系统


二、Claude Code / Codex 的真实架构(推测还原)

结合公开信息 + 实际使用体验,可以抽象成👇

text 复制代码
用户输入
   ↓
Agent Runtime(核心系统)
   ↓
Planner(规划)
   ↓
Executor(执行)
   ↓
Environment(环境)
   ↓
Feedback Loop(反馈)
   ↺(循环)

👉 核心一句话:

它们是一个"单Agent循环系统 + 外部环境驱动"的架构


三、核心机制:那个最关键的"Agent Loop"

官方其实已经给出过线索:

text 复制代码
gather context → take action → verify → repeat

(Anthropic)


👉 翻译成人话就是:

text 复制代码
读信息 → 动手做 → 看结果 → 再决定

✔️ 完整循环:

text 复制代码
while not done:
    读取当前状态
    规划下一步
    执行动作
    观察结果
    判断是否成功

👉 回答你最关键的问题:

❓它们有没有:

  • 状态 ✅
  • 规划 ✅
  • 执行 ✅
  • 反馈 ✅
  • 失败重试 ✅

👉 答案:全都有,而且这是核心能力


四、逐层拆解(工程级视角)


1️⃣ Agent Runtime(真正的大脑)

这是最容易被忽略的一层。

👉 它负责:

  • 控制循环(loop)
  • 管理上下文
  • 控制工具调用
  • 控制token成本
  • 管理任务生命周期

👉 本质:

text 复制代码
LLM ≠ Agent
Agent = Runtime + LLM

2️⃣ Planner(规划系统)

Claude Code 有一个非常典型的特征:

👉 会生成 TODO / 计划列表 (PromptLayer)


👉 说明它内部做了:

text 复制代码
任务 → 拆步骤 → 逐步执行

👉 可实现版本(你可以自己做):

python 复制代码
def plan(task):
    return llm("""
    将任务拆解为步骤列表:
    {}
    """.format(task))

👉 这其实就是:

Plan-and-Execute 模式


3️⃣ Executor(执行系统)

区别普通Agent的关键点👇


❌ 普通Agent:

text 复制代码
call_tool → return

✅ Claude Code / Codex:

text 复制代码
- 读文件
- 写文件
- 执行shell
- 跑测试

👉 即:

操作真实环境(Environment)


👉 官方描述也验证了:

  • 编辑文件
  • 执行命令
    (Claude)

👉 可实现版本:

python 复制代码
class Executor:

    def run(action):
        if action.type == "edit_file":
            write_file(action.path, action.content)

        elif action.type == "run_cmd":
            return subprocess.run(action.cmd)

4️⃣ Environment(环境层)🔥核心

这是绝大多数人没意识到的:


👉 Codex:

  • 每个任务运行在 sandbox 环境 (OpenAI)

👉 Claude Code:


👉 本质:

text 复制代码
Agent不是在"想"
而是在"与环境交互"

👉 这一步带来的质变:

能力 普通LLM Agent
写代码
运行代码
修Bug
自动迭代

5️⃣ Feedback Loop(最关键)

Claude Code 的行为本质:

text 复制代码
请求工具 → 执行 → 返回结果 → 再判断

(virtuslab.com)


👉 这就是:

text 复制代码
执行 → 观察 → 判断 → 再执行

👉 可实现版本:

python 复制代码
while True:

    action = llm(state)

    result = executor.run(action)

    state.update(result)

    if is_done(state):
        break

👉 这一步,就是:

让模型"用结果修正自己"


五、Claude Code vs Codex 架构差异(重点)


👉 Claude Code(偏"规划型Agent")

特点:

  • 单循环(single loop) (PromptLayer)
  • TODO planning
  • 强解释能力

👉 更像:

text 复制代码
一个会思考的工程师

👉 Codex(偏"执行型Agent")

特点:

  • 多任务并行(parallel tasks) (OpenAI)
  • sandbox隔离
  • 更偏工程执行

👉 更像:

text 复制代码
一个自动化开发流水线

六、你可以自己实现一个"简化版 Claude Code"


👉 最小架构(可落地)

text 复制代码
1. Agent Loop
2. Planner(LLM)
3. Executor(工具)
4. State Store
5. Environment(本地/容器)

👉 代码骨架:

python 复制代码
class Agent:

    def run(task):

        state = init_state(task)

        while not state.done:

            plan = planner(state)

            action = choose_action(plan)

            result = executor.run(action)

            state.update(result)

        return state.result

七、升级版本(结合你的MCP)

你可以直接升级成:

text 复制代码
Agent → MCP → Tools / Models

👉 MCP负责:

  • 工具抽象
  • 多模型调度
  • 权限控制
  • fallback

👉 这就是:

工业级Agent架构


八、总结(最关键一句话)

Claude Code / Codex 不是"会写代码的模型",而是"一个运行在真实环境中的闭环Agent系统"。


九、给你的一个关键启发(非常重要)

如果你想做更强的Agent:


❌ 不要再优化:

  • prompt
  • few-shot

✅ 应该优化:

  • 环境(Environment)
  • 状态(State)
  • 循环(Loop)
  • 调度(Orchestration)

👉 因为:

智能不在模型里,而在系统里

相关推荐
东坡肘子11 小时前
SPI 加入 Apple,Swift 迈向自举 -- 肘子的 Swift 周报 #142
人工智能·swiftui·swift
doiito11 小时前
【Agent Harness】Gliding Horse 核心设计理念,不跟风开发自己的AI Agent
ai·rust·架构设计·系统设计·ai agent
小和尚同志20 小时前
AI 自动化测试探索(二):Chrome-devtools MCP
人工智能·e2e·aigc
AlbertZein20 小时前
Agent 场景下,谁才是真正好用的 Flash 模型
aigc·ai编程
uccs20 小时前
流式响应的三次进化:EventSource → ReadableStream → TransformStream
openai·ai编程·claude
冬奇Lab1 天前
Workflow 系列(02):设计范式——四层架构、三种 Context 传递模式与确认门设计
人工智能·agent·工作流引擎
冬奇Lab1 天前
每日一个开源项目(第145篇):Trellis - 把项目记忆、规范和任务上下文持久化进代码仓库
人工智能·开源·资讯
有道AI情报局1 天前
Harness即产品
人工智能·agent
罗西的思考1 天前
机器人 / 强化学习】HIL-SERL:人类在环驱动的具身智能进化框架
人工智能·算法·机器学习