从一个 while 循环开始,搭一个完整的 AI Agent(参考开源项目 learn claude code)

复制代码
# 从一个 while 循环开始,搭一个完整的 AI Agent(参考开源项目 learn claude code)

写在前面

这系列文章记录了我拆解 Claude Code 源码的过程。

起因很简单:用了几个月 Claude Code,越用越好奇------它到底是怎么做到"自己写代码、自己跑测试、自己修 bug"的?于是我学习开源项目learn claude code总结了一下自己的学习经验,拆成了 12 个最小可运行的 demo,从最简单的 while + tool_use 开始,一步步搭到多 Agent 团队协作。

全文地图

复制代码
s01  Agent Loop           while + tool_use,一切的起点
s02  多工具               dispatch map,加工具不改循环
s03  待办管理             模型自己列计划,3 轮不更新就催它
s04  子智能体             独立上下文,干完只返回摘要
s05  技能加载             system prompt 放名称,按需加载完整内容
s06  上下文压缩           三层压缩,换个方式"忘记"
s07  持久化任务           任务写磁盘,带依赖关系
s08  后台任务             子线程跑命令,主线程不卡住
s09  团队协作             队友 + JSONL 收件箱
s10  团队协议             request_id 关联的请求-响应握手
s11  自治                 队友自己看板抢活,身份重注入
s12  目录隔离             每个任务一个 git worktree

核心洞察

每一步解决一个问题,加一个机制,循环永远不变。

s01 的循环是这样的:

python 复制代码
while True:
    response = LLM(messages, tools)
    if response.stop_reason != "tool_use":
        break
    执行工具 → 结果追加到 messages

s12 的循环还是这样。变的是 tools 列表越来越长,messages 越来越聪明(会压缩、会注入、会重唤醒),但骨架没动过。

这就是 Agent 的本质:一个循环,加上模型能调用的工具。 工具决定了 Agent 能做什么,循环决定了 Agent 能做多久。

从 demo 到产品

这 12 个 demo 覆盖了 Claude Code 的核心机制:

demo Claude Code 对应
s01-s02 工具系统(Bash、Read、Write、Edit)
s03 TaskCreate / TaskUpdate
s04 Agent 子代理
s05 Skill 按需加载
s06 上下文压缩(auto-compact)
s07 任务持久化(.tasks/)
s08 后台任务(BackgroundManager)
s09-s10 多 Agent 通信
s11 自治 Agent + 身份重注入
s12 Worktree 隔离

当然,真实产品比 demo 复杂得多------错误处理、权限控制、安全沙箱、流式输出、UI 交互......但骨架是一样的。

怎么用这些 demo

每个 demo 都能独立运行:

bash 复制代码
cd agents
python s01_minimal_demo.py    # 最小 agent
python s02_minimal_demo.py    # 多工具
# ...
python full_demo.py           # 完整版

建议从 s01 开始,每个跑一遍,看一遍注释,理解了再往下走。跳步容易迷路。

技术栈

  • Python 3.10+
  • Anthropic SDK (anthropic)
  • 环境变量:ANTHROPIC_API_KEYMODEL_IDANTHROPIC_BASE_URL(可选)

最后

写这些 demo 的过程中,我最大的感受是:Agent 不是一个模型,是一个系统。模型只是其中一环,真正让 Agent 工作起来的是周围的 harness------工具定义、上下文管理、任务调度、团队通信、目录隔离。

模型决定了 Agent 的上限,harness 决定了 Agent 能不能稳定地接近那个上限。

**如果感兴趣的话欢迎关注我该专栏("learn claude code")我会持续更新

相关推荐
qq_454245031 小时前
复用的逻辑与数学基础:论“电力–机械”解耦的智能体架构必然性
人工智能·架构
j_xxx404_1 小时前
Linux进程信号:内核数据结构与捕捉递达全流程
linux·运维·服务器·人工智能·ai
WL_Aurora1 小时前
Python爬虫实战(一):图书网站API接口爬取
爬虫·python
沙振宇1 小时前
【Python】使用YOLO8识别视频中的车与人物
python·yolo·音视频·状态模式·识别
LLM精进之路1 小时前
IEEE 26 | 参数量不是关键:4B模型VeriGround在匿名化电路生成任务上性能超越GPT-5.4
人工智能·gpt·深度学习·机器学习
Ulyanov1 小时前
《从质点到位姿:基于Python与PyVista的导弹制导控制全栈仿真》: 基石——3-DOF质点弹道的高保真建模与数值稳定性分析
开发语言·python·算法·ui·系统仿真
源码之家1 小时前
计算机毕业设计:Python医疗数据可视化系统 Flask框架 数据分析 可视化 医疗大数据 用户画像(建议收藏)✅
python·深度学习·信息可视化·数据分析·django·flask·课程设计
weixin_699602441 小时前
Wan Tasks API 集成与使用指南
ai
陈嘿萌1 小时前
学术速递|2026年4月 arXiv 图像融合论文汇总(04.01–04.30)10 篇最新成果
人工智能·机器学习·计算机视觉·图像融合·arxiv