从一个 while 循环开始,搭一个完整的 AI Agent(参考开源项目 learn claude code)

复制代码
# 从一个 while 循环开始,搭一个完整的 AI Agent(参考开源项目 learn claude code)

写在前面

这系列文章记录了我拆解 Claude Code 源码的过程。

起因很简单:用了几个月 Claude Code,越用越好奇------它到底是怎么做到"自己写代码、自己跑测试、自己修 bug"的?于是我学习开源项目learn claude code总结了一下自己的学习经验,拆成了 12 个最小可运行的 demo,从最简单的 while + tool_use 开始,一步步搭到多 Agent 团队协作。

全文地图

复制代码
s01  Agent Loop           while + tool_use,一切的起点
s02  多工具               dispatch map,加工具不改循环
s03  待办管理             模型自己列计划,3 轮不更新就催它
s04  子智能体             独立上下文,干完只返回摘要
s05  技能加载             system prompt 放名称,按需加载完整内容
s06  上下文压缩           三层压缩,换个方式"忘记"
s07  持久化任务           任务写磁盘,带依赖关系
s08  后台任务             子线程跑命令,主线程不卡住
s09  团队协作             队友 + JSONL 收件箱
s10  团队协议             request_id 关联的请求-响应握手
s11  自治                 队友自己看板抢活,身份重注入
s12  目录隔离             每个任务一个 git worktree

核心洞察

每一步解决一个问题,加一个机制,循环永远不变。

s01 的循环是这样的:

python 复制代码
while True:
    response = LLM(messages, tools)
    if response.stop_reason != "tool_use":
        break
    执行工具 → 结果追加到 messages

s12 的循环还是这样。变的是 tools 列表越来越长,messages 越来越聪明(会压缩、会注入、会重唤醒),但骨架没动过。

这就是 Agent 的本质:一个循环,加上模型能调用的工具。 工具决定了 Agent 能做什么,循环决定了 Agent 能做多久。

从 demo 到产品

这 12 个 demo 覆盖了 Claude Code 的核心机制:

demo Claude Code 对应
s01-s02 工具系统(Bash、Read、Write、Edit)
s03 TaskCreate / TaskUpdate
s04 Agent 子代理
s05 Skill 按需加载
s06 上下文压缩(auto-compact)
s07 任务持久化(.tasks/)
s08 后台任务(BackgroundManager)
s09-s10 多 Agent 通信
s11 自治 Agent + 身份重注入
s12 Worktree 隔离

当然,真实产品比 demo 复杂得多------错误处理、权限控制、安全沙箱、流式输出、UI 交互......但骨架是一样的。

怎么用这些 demo

每个 demo 都能独立运行:

bash 复制代码
cd agents
python s01_minimal_demo.py    # 最小 agent
python s02_minimal_demo.py    # 多工具
# ...
python full_demo.py           # 完整版

建议从 s01 开始,每个跑一遍,看一遍注释,理解了再往下走。跳步容易迷路。

技术栈

  • Python 3.10+
  • Anthropic SDK (anthropic)
  • 环境变量:ANTHROPIC_API_KEYMODEL_IDANTHROPIC_BASE_URL(可选)

最后

写这些 demo 的过程中,我最大的感受是:Agent 不是一个模型,是一个系统。模型只是其中一环,真正让 Agent 工作起来的是周围的 harness------工具定义、上下文管理、任务调度、团队通信、目录隔离。

模型决定了 Agent 的上限,harness 决定了 Agent 能不能稳定地接近那个上限。

**如果感兴趣的话欢迎关注我该专栏("learn claude code")我会持续更新

相关推荐
甲维斯36 分钟前
500块的豆包,能帮我搞定这个么?!
人工智能
火山引擎开发者社区1 小时前
当 Agent 自己做 SRE:详解 ArkClaw 自动化可观测体系的工程实践
人工智能
Coffeeee3 小时前
两个例子,帮你快速理解什么是Token
人工智能·程序员·ai编程
饼干哥哥3 小时前
用AI全自动剪辑,日更 100条爆款视频——HyperFrames、Remotion、Git使用入门
人工智能·机器学习·ai编程
用户83244598541323 小时前
深入拆解 AlexNet:跟着一张猫咪照片,看数据如何流动
人工智能
饼干哥哥3 小时前
开源Skills|搭建亚马逊动态关键词库系统,每天抓SSS级机会词
人工智能·深度学习·数据分析
Weigang4 小时前
别等 Agent 上线后补评估:先用 DeepEval 写失败样本
人工智能
MomentYY4 小时前
AI 到底是“懂”,还是在“猜”?
前端·人工智能·ai编程
拾光拾趣录4 小时前
为什么采用多路检索而不是单一向量检索?
人工智能
拾光拾趣录4 小时前
Agent 编排器是怎么设计的?为什么这样设计?
人工智能