Claude Code / Codex 架构推测 + 可实现版本设计(从0到1复刻一个Agent系统)

一、先说结论:它们的核心不是"模型",而是一个"Agent运行时系统"

很多人以为:

Claude Code / Codex = 更强的模型

但官方信息已经很明确:

  • 能读代码仓库、改文件、执行命令 (Claude)
  • 能在 sandbox 里执行任务、并行处理多个任务 (OpenAI)

👉 本质已经不是"生成代码",而是:

一个运行在真实环境中的Agent系统


二、Claude Code / Codex 的真实架构(推测还原)

结合公开信息 + 实际使用体验,可以抽象成👇

text 复制代码
用户输入
   ↓
Agent Runtime(核心系统)
   ↓
Planner(规划)
   ↓
Executor(执行)
   ↓
Environment(环境)
   ↓
Feedback Loop(反馈)
   ↺(循环)

👉 核心一句话:

它们是一个"单Agent循环系统 + 外部环境驱动"的架构


三、核心机制:那个最关键的"Agent Loop"

官方其实已经给出过线索:

text 复制代码
gather context → take action → verify → repeat

(Anthropic)


👉 翻译成人话就是:

text 复制代码
读信息 → 动手做 → 看结果 → 再决定

✔️ 完整循环:

text 复制代码
while not done:
    读取当前状态
    规划下一步
    执行动作
    观察结果
    判断是否成功

👉 回答你最关键的问题:

❓它们有没有:

  • 状态 ✅
  • 规划 ✅
  • 执行 ✅
  • 反馈 ✅
  • 失败重试 ✅

👉 答案:全都有,而且这是核心能力


四、逐层拆解(工程级视角)


1️⃣ Agent Runtime(真正的大脑)

这是最容易被忽略的一层。

👉 它负责:

  • 控制循环(loop)
  • 管理上下文
  • 控制工具调用
  • 控制token成本
  • 管理任务生命周期

👉 本质:

text 复制代码
LLM ≠ Agent
Agent = Runtime + LLM

2️⃣ Planner(规划系统)

Claude Code 有一个非常典型的特征:

👉 会生成 TODO / 计划列表 (PromptLayer)


👉 说明它内部做了:

text 复制代码
任务 → 拆步骤 → 逐步执行

👉 可实现版本(你可以自己做):

python 复制代码
def plan(task):
    return llm("""
    将任务拆解为步骤列表:
    {}
    """.format(task))

👉 这其实就是:

Plan-and-Execute 模式


3️⃣ Executor(执行系统)

区别普通Agent的关键点👇


❌ 普通Agent:

text 复制代码
call_tool → return

✅ Claude Code / Codex:

text 复制代码
- 读文件
- 写文件
- 执行shell
- 跑测试

👉 即:

操作真实环境(Environment)


👉 官方描述也验证了:

  • 编辑文件
  • 执行命令
    (Claude)

👉 可实现版本:

python 复制代码
class Executor:

    def run(action):
        if action.type == "edit_file":
            write_file(action.path, action.content)

        elif action.type == "run_cmd":
            return subprocess.run(action.cmd)

4️⃣ Environment(环境层)🔥核心

这是绝大多数人没意识到的:


👉 Codex:

  • 每个任务运行在 sandbox 环境 (OpenAI)

👉 Claude Code:


👉 本质:

text 复制代码
Agent不是在"想"
而是在"与环境交互"

👉 这一步带来的质变:

能力 普通LLM Agent
写代码
运行代码
修Bug
自动迭代

5️⃣ Feedback Loop(最关键)

Claude Code 的行为本质:

text 复制代码
请求工具 → 执行 → 返回结果 → 再判断

(virtuslab.com)


👉 这就是:

text 复制代码
执行 → 观察 → 判断 → 再执行

👉 可实现版本:

python 复制代码
while True:

    action = llm(state)

    result = executor.run(action)

    state.update(result)

    if is_done(state):
        break

👉 这一步,就是:

让模型"用结果修正自己"


五、Claude Code vs Codex 架构差异(重点)


👉 Claude Code(偏"规划型Agent")

特点:

  • 单循环(single loop) (PromptLayer)
  • TODO planning
  • 强解释能力

👉 更像:

text 复制代码
一个会思考的工程师

👉 Codex(偏"执行型Agent")

特点:

  • 多任务并行(parallel tasks) (OpenAI)
  • sandbox隔离
  • 更偏工程执行

👉 更像:

text 复制代码
一个自动化开发流水线

六、你可以自己实现一个"简化版 Claude Code"


👉 最小架构(可落地)

text 复制代码
1. Agent Loop
2. Planner(LLM)
3. Executor(工具)
4. State Store
5. Environment(本地/容器)

👉 代码骨架:

python 复制代码
class Agent:

    def run(task):

        state = init_state(task)

        while not state.done:

            plan = planner(state)

            action = choose_action(plan)

            result = executor.run(action)

            state.update(result)

        return state.result

七、升级版本(结合你的MCP)

你可以直接升级成:

text 复制代码
Agent → MCP → Tools / Models

👉 MCP负责:

  • 工具抽象
  • 多模型调度
  • 权限控制
  • fallback

👉 这就是:

工业级Agent架构


八、总结(最关键一句话)

Claude Code / Codex 不是"会写代码的模型",而是"一个运行在真实环境中的闭环Agent系统"。


九、给你的一个关键启发(非常重要)

如果你想做更强的Agent:


❌ 不要再优化:

  • prompt
  • few-shot

✅ 应该优化:

  • 环境(Environment)
  • 状态(State)
  • 循环(Loop)
  • 调度(Orchestration)

👉 因为:

智能不在模型里,而在系统里

相关推荐
AI服务老曹2 小时前
源码级解耦:企业级 AI 视频中台的二次开发实践与 API 生态
人工智能
AI自动化工坊2 小时前
OpenFang实战指南:用Rust构建高并发AI Agent操作系统
开发语言·人工智能·ai·rust·agent·ai agent
青梅煮酒与君饮2 小时前
浅谈大模型、Agent、Function Calling、MCP、Skill、Subagent、Langchain、Workflow
人工智能·python·语言模型·langchain·llama
是Smoky呢2 小时前
springAI+向量数据库(SimpleVectorStore)+RAG深度理解
spring·aigc·ai编程
清空mega2 小时前
动手学深度学习——填充和步幅详解:卷积输出尺寸到底怎么控制?
人工智能·深度学习
damo王2 小时前
云浏览器:让 AI Agent 真正拥有“眼睛“——火山引擎 ArkClaw 新功能体验
人工智能·microsoft·火山引擎·ai agent
cxr8282 小时前
Claw-Code 净室重写真实性验证分析
人工智能·ai智能体
财经汇报3 小时前
“蜂联AI Agent”推动普惠创新 看AI如何助力供应链金融
大数据·人工智能·金融
咕噜签名-铁蛋3 小时前
云部署 OpenClaw 与飞书无缝对接完整指南
服务器·人工智能·飞书