从一个 while 循环开始,搭一个完整的 AI Agent(参考开源项目 learn claude code)

复制代码
# 从一个 while 循环开始,搭一个完整的 AI Agent(参考开源项目 learn claude code)

写在前面

这系列文章记录了我拆解 Claude Code 源码的过程。

起因很简单:用了几个月 Claude Code,越用越好奇------它到底是怎么做到"自己写代码、自己跑测试、自己修 bug"的?于是我学习开源项目learn claude code总结了一下自己的学习经验,拆成了 12 个最小可运行的 demo,从最简单的 while + tool_use 开始,一步步搭到多 Agent 团队协作。

全文地图

复制代码
s01  Agent Loop           while + tool_use,一切的起点
s02  多工具               dispatch map,加工具不改循环
s03  待办管理             模型自己列计划,3 轮不更新就催它
s04  子智能体             独立上下文,干完只返回摘要
s05  技能加载             system prompt 放名称,按需加载完整内容
s06  上下文压缩           三层压缩,换个方式"忘记"
s07  持久化任务           任务写磁盘,带依赖关系
s08  后台任务             子线程跑命令,主线程不卡住
s09  团队协作             队友 + JSONL 收件箱
s10  团队协议             request_id 关联的请求-响应握手
s11  自治                 队友自己看板抢活,身份重注入
s12  目录隔离             每个任务一个 git worktree

核心洞察

每一步解决一个问题,加一个机制,循环永远不变。

s01 的循环是这样的:

python 复制代码
while True:
    response = LLM(messages, tools)
    if response.stop_reason != "tool_use":
        break
    执行工具 → 结果追加到 messages

s12 的循环还是这样。变的是 tools 列表越来越长,messages 越来越聪明(会压缩、会注入、会重唤醒),但骨架没动过。

这就是 Agent 的本质:一个循环,加上模型能调用的工具。 工具决定了 Agent 能做什么,循环决定了 Agent 能做多久。

从 demo 到产品

这 12 个 demo 覆盖了 Claude Code 的核心机制:

demo Claude Code 对应
s01-s02 工具系统(Bash、Read、Write、Edit)
s03 TaskCreate / TaskUpdate
s04 Agent 子代理
s05 Skill 按需加载
s06 上下文压缩(auto-compact)
s07 任务持久化(.tasks/)
s08 后台任务(BackgroundManager)
s09-s10 多 Agent 通信
s11 自治 Agent + 身份重注入
s12 Worktree 隔离

当然,真实产品比 demo 复杂得多------错误处理、权限控制、安全沙箱、流式输出、UI 交互......但骨架是一样的。

怎么用这些 demo

每个 demo 都能独立运行:

bash 复制代码
cd agents
python s01_minimal_demo.py    # 最小 agent
python s02_minimal_demo.py    # 多工具
# ...
python full_demo.py           # 完整版

建议从 s01 开始,每个跑一遍,看一遍注释,理解了再往下走。跳步容易迷路。

技术栈

  • Python 3.10+
  • Anthropic SDK (anthropic)
  • 环境变量:ANTHROPIC_API_KEYMODEL_IDANTHROPIC_BASE_URL(可选)

最后

写这些 demo 的过程中,我最大的感受是:Agent 不是一个模型,是一个系统。模型只是其中一环,真正让 Agent 工作起来的是周围的 harness------工具定义、上下文管理、任务调度、团队通信、目录隔离。

模型决定了 Agent 的上限,harness 决定了 Agent 能不能稳定地接近那个上限。

**如果感兴趣的话欢迎关注我该专栏("learn claude code")我会持续更新

相关推荐
MacroZheng2 小时前
阿里Qoder + GLM-5.1,夯爆了!
前端·vue.js·人工智能
郑洁文2 小时前
基于卷积神经网络的智能车牌识别系统
人工智能·深度学习·神经网络·车牌识别
贾修行2 小时前
大模型微调实战指南:从技术原理到Qwen多模型矩阵的工程
人工智能
春日见2 小时前
五分钟入门强化学习DDPG
大数据·人工智能·算法·机器学习·计算机视觉
小真zzz2 小时前
当“虚构的解决方案”成为试金石:搜极星如何将市场幻想变为可验证的现实?
搜索引擎·ai·大模型·deepseek
jeffer_liu2 小时前
Spring AI 生产级实战:记忆管理
java·人工智能·后端·spring·语言模型
土星云SaturnCloud2 小时前
基于边缘计算的商场智慧运营架构设计与AI落地实践
服务器·人工智能·ai·边缘计算
vivo互联网技术2 小时前
ICLR 2026 | LiveMoments 用参考图引导的扩散模型提升重选封面帧画质
人工智能·算法·aigc技术探索
Wonderful U2 小时前
Python+Django实战|个人博客内容管理系统:搭建轻量化、高自由度的个人动态博客CMS系统
人工智能·python·django