开发者正在抛弃 Copilot，转向 AI Loop

从 autocomplete 到 autonomous loop，编程范式的结构性转移已经发生。这不是渐进优化，是从手动挡换自动挡。

最近半年，我注意到一个有意思的现象：身边越来越多的开发者，不再把 AI 当打字加速器用了。

他们打开 Claude Code 或者 Codex，输入一句"帮我把这个模块重构一下"，然后就去泡咖啡了。回来一看，代码改完了，测试跑过了，PR 都提好了。

说实话，第一次看到这种用法的时候，我心里是有点不舒服的------写代码不看 diff，这能靠谱吗？

但我很快意识到，我抗拒的不是这个工具，而是这种工作方式对我的身份认同的挑战。我是一个"写代码的人"，现在有人在替我写代码了。这种感觉，像是老司机第一次坐上自动驾驶的车，脚不由自主地想去踩刹车。

但趋势不会因为个人的不适而停止。从 Copilot 的 autocomplete，到 Cursor 的 agent mode，再到 Claude Code 和 OpenAI Codex 的 autonomous loop------开发者正在经历一次从"手动挡"到"自动挡"的范式转移。

这篇文章，我想系统性地聊聊这件事。

AI 编程辅助三阶段演化信息图

一、从 Autocomplete 到 Agent Loop：三个阶段

要理解这次转移，得先看清编程辅助工具的演化路径。我把过去三年分成三个阶段。

阶段一：Autocomplete（2021-2023）

GitHub Copilot 代表了这个阶段的巅峰。它的核心交互模型是"你打字，AI补全"。

你敲一个函数名，它猜你想写什么。你写个注释，它生成对应的实现。你按 Tab 接受，继续往下写。

这个模型的本质是AI 作为打字加速器。你仍然是驾驶员，AI 是副驾驶。你的大脑在做所有决策，AI 只是帮你减少击键次数。

Copilot 做到了一件了不起的事：让 AI 编程辅助第一次大规模进入开发者的日常工作流。但它有一个根本性的局限------它只能看到光标前后的上下文，不能执行任何操作。它不能运行测试、不能跨文件修改、不能验证自己的输出。

阶段二：Agent Mode（2024-2025）

Cursor 掀起了第二波。它的 agent mode 把交互模型从"你打字，AI补全"变成了"你描述需求，AI执行"。

关键区别在哪？AI 可以调用工具了。 它能读文件、写文件、跑终端命令。你能说"帮我修这个 bug"，它会自己去找代码、改代码、跑测试。

但 Cursor 的 agent mode 仍然是一个"半自动"模式------你需要盯着它，随时准备介入。它在你的编辑器里运行，每一步都需要你的注意。

不过，这已经是一个质变了。编程的交互单位从"一行代码"变成了"一个任务"。你不再逐行审查 AI 的每一个补全，而是审查一个任务级别的 diff。

阶段三：Autonomous Loop（2025-2026）

Claude Code、OpenAI Codex、Cursor Background Agent 代表了第三阶段。核心变化是：AI 在一个自主循环里工作，你不需要盯着它。

Claude Code 的架构团队把它叫做"nO"------一个单线程的主循环。Anthropic 官方文档把它描述为三个阶段的循环：收集上下文 → 采取行动 → 验证结果，周而复始直到任务完成。循环的逻辑极其简洁：

lua 复制代码

while(tool_call) → execute tool → feed results → repeat

当模型产生了纯文本回复（没有工具调用），循环终止，把控制权交还给用户。

图片来源：blog.promptlayer.com/claude-code...

这个循环不是简单的"做一步看一步"。它包含了：

TodoWrite：结构化的任务规划系统，把工作拆成带 ID、状态、优先级的 checklist
Compressor wU2：上下文压缩器，在 context window 用到 92% 时自动触发，把对话总结存入长期记忆
h2A 异步队列：允许用户在 agent 工作时中途插话、纠正方向，不用从头来

OpenAI Codex 的长期任务模式更进一步。OpenAI 开发者 Derrick Choi 做了一个实验：给 Codex 一个空白仓库，让它从零构建一个设计工具。它跑了25 小时不间断，消耗了 1300 万 token，生成了 3 万行代码------包括画布编辑、实时协作、图层管理、评论系统等 10 个完整功能。

Anthropic 自己也做了类似的极限实验。研究员 Nicholas Carlini 用近 2000 个 Claude Code session，两周内消耗了 20 亿输入 token、1.4 亿输出 token，花了约 2 万美元，产出了一个 10 万行的 Rust 编写的 C 编译器。这个编译器通过了程序员的终极测试------它能编译并运行 Doom。

这些不是演示级代码，是可运行的、带测试的、有文档的产品级代码。

从 Tab 键到回车键，从光标到终端，从旁观到自主------这不是渐进优化，这是范式转移。

Anthropic 官方对 agentic loop 的定义很简单："Agents are typically just LLMs using tools based on environmental feedback in a loop."------agent 通常就是 LLM 在环境反馈的循环中使用工具。没有魔法，就是循环。

图片来源：www.anthropic.com/engineering...

二、为什么是 Loop 而不是一次性生成？

很多人会问：GPT 已经能生成完整函数了，为什么还需要"循环"？

因为真实世界的编程不是一次性生成，而是一个不断试错、验证、修正的过程。

一次性生成的致命缺陷

传统的大模型代码生成有一个根本问题：没有反馈回路。

模型生成代码，但它看不到执行结果。代码跑不跑得通？有没有 bug？测试过不过？它不知道。所以它只能在第一次输出时就赌对------这在简单任务上还行，复杂任务上几乎不可能。

这就像让一个程序员在完全不运行代码的情况下写完一整个功能------没有人这么干活。

Loop 的本质是引入环境反馈

AI Loop 解决的正是这个问题。它的核心机制是：

Plan------规划要做什么
Edit code------修改代码
Run tools------运行测试、构建、lint
Observe results------观察结果
Repair failures------修复失败
Repeat------重复

这个循环提供了三个关键要素：真实反馈 （错误、diff、日志）、外部化状态 （仓库、文件、worktree）、可操纵性（根据结果纠偏）。

OpenAI 在官方博客中总结得很好：让 agent 保持长时间一致性的关键不是模型更聪明，而是"agent 可以在更长时间内保持一致，端到端完成更大的工作块，并在出错时恢复而不丢失上下文"。

METR 的研究也支持这一点：前沿 agent 能以 50-80% 可靠性完成的任务长度，大约每 7 个月翻一倍。

AI Loop 不是让模型更聪明，而是让模型能犯错和纠错。这才是自主编程的基础。

三、谁在造 Loop：三大阵营的路线分歧

当下自主编程 Loop 的实现，已经形成了三个截然不同的技术路线。

路线一：单线程主循环------Claude Code

Anthropic 选择了最简单的架构：一个主循环 + 一条平铺的消息历史 + 受控的子 agent。

这个选择不是偷懒，而是深思熟虑。

Anthropic 工程博客的原话是："一个简单、单线程的主循环，配合规范化的工具和规划，就能实现可控的自主性。"他们刻意避免了 multi-agent swarm 那种复杂的架构，原因很直接------可调试性。当出了问题，你需要能回溯到具体的某一步、某一个工具调用，而不是在一堆互相影响的 agent 之间迷失。

他们的子 agent 系统（I2A）也遵循同样的哲学：子 agent 有严格的深度限制，不能递归派生新的子 agent。结果作为普通工具输出回传主循环，保持单线程的简洁。

实际效果？用户开始 24/7 不间断运行 Claude Code，Anthropic 不得不设置每周使用上限。

路线二：可配置的多线程------OpenAI Codex

OpenAI 走了另一条路。Codex 支持自定义 agent，每个 agent 都有独立的配置文件（TOML 格式），包含名称、描述、指令、模型选择、沙箱模式、MCP 服务器配置。

内置了三种 agent：default（通用）、worker（执行导向）、explorer（只读探索）。用户可以自定义更多。

Codex 还支持 CSV 批处理模式------给一个 CSV 文件，每行一个任务，Codex 为每行启动一个 worker agent，并行处理后输出结果。这对于"给 100 个文件加同样的注释"这种重复性任务非常有效。

这种设计更灵活，但也更复杂。Codex 的 max_depth 参数（控制 agent 嵌套深度）默认为 1，文档警告："提高这个值可能导致广泛的 fan-out，增加 token 使用量、延迟和本地资源消耗。"

路线三：Harness 工程 + Cloud Agent------Cursor

Cursor 的思路不一样。他们认为关键不是 agent 本身，而是包裹 agent 的 harness------工具定义、上下文管理、错误恢复、模型适配。

Cursor CEO Michael Truell 在博客中把 AI 编程辅助分成三个时代：Tab Autocomplete（近两年）、Synchronous Agents（可能不到一年）、Autonomous Cloud Agents（当前正在进入）。他写了一句话我觉得特别精准："Cursor 不再主要是写代码的工具了。它是帮开发者建造生产软件的工厂。"

Cursor 内部数据：35% 的 PR 是由自主 cloud agent 创建的。这些 agent 跑在独立的 VM 上，用自己的 Temporal 工作流引擎管理状态，agent loop 不在 VM 上而在 Temporal 里------这意味着即使 VM 崩溃，agent 也不会丢失上下文。

他们的 eval 体系特别有意思：

Keep Rate：agent 提出的代码修改在固定时间后还保留多少------用户手动改了多少就说明 agent 改得不好
LM 满意度检测：用语言模型读取用户的后续回复，判断是否满意。继续提下一个需求 = 成功，贴 stack trace = 失败
自动化修复管道：每周用 Cloud Agent 扫描日志，发现新问题或突增问题，自动创建 ticket 并修复。最终把意外工具调用错误降低了一个数量级

Cursor 还发现了一个反直觉的事：随着模型能力提升，他们移除了越来越多的静态上下文和 guardrail。早期模型不擅长选择上下文，所以 Cursor 强制注入大量信息；现在模型自己就能判断需要什么，guardrail 反而碍事。

三种路线，三种哲学：简洁可控 vs 灵活可配 vs harness 优先。但核心都是同一个东西------让 AI 在环境反馈的循环中自主工作。

还有一条值得一提的路线------Cognition 的 Devin。他们最初在 2024 年 3 月以"第一个自主软件工程师"的身份亮相，SWE-bench 13.86% 的通过率远超当时的 1.96% 基线。但更有意思的是他们对多 agent 架构的态度变化：2025 年 6 月发了一篇"Dont Build Multi-Agents"，批评 OpenAI Swarm 和 Microsoft AutoGen 是"错误的方式"；10 个月后又发了一篇"Multi-Agents: Whats Actually Working"，承认在"agent 贡献智能、但写入保持单线程"的模式下多 agent 是有效的。Devin 还提出了一个"Closing the Agent Loop"的概念------Write → Catch → Fix → Merge，让编码 agent 和审查 agent 形成闭环。Cognition 的总结很到位："A coding agent is a tool. A coding agent paired with a review agent --- thats a system. Systems compound. Tools dont."

四、真实开发者怎么用的：从 Vibe Coding 到 Agentic Engineering

说完架构，聊点接地气的。开发者到底怎么用这些工具的？

Vibe Coding：2025 年的年度词汇

2025 年 2 月，Andrej Karpathy 发了一条推文，创造了一个词------"vibe coding"。

他的原话是："有一种新的编码方式，我称之为 vibe coding，你完全凭感觉，拥抱指数级增长，甚至忘了代码不是自己写的。"

到 2025 年底，"vibe coding"成了柯林斯词典的年度词汇。25% 的 Y Combinator W2025 批次创业公司使用 95% 以上的 AI 生成代码。Cursor 以不到 30 人的团队创造了 5 亿美元 ARR------人均产出超过 1600 万美元。

Vibe coding 的核心体验是：你描述意图，AI 生成代码，你接受。Karpathy 说自己 "Accept All 永远点，不看 diff 了"。

但这里有一个更疯狂的数据：Claude Code 负责人 Boris Cherny 在 2026 年 2 月的一次播客里直接说"Coding is solved"。他声称 Claude Code 已经占了公开 GitHub commit 的 4%，日活用户"上个月又翻了一倍"。Spotify 据说最好的开发者"从去年 12 月就没写过一行代码了"。

反对的声音：Bram Cohen 的批评

BitTorrent 创始人 Bram Cohen 写了一篇文章，标题是"The Cult of Vibe Coding Is Insane"。

他的核心论点：糟糕的软件是你自己选的，不是不可避免的。 Karpathy 说不看 diff，Cohen 说这恰恰是问题------即使是 vibe coder，实际上也在做人类贡献：写 plan 文件、建 skills、定 rules。"机器在没有框架的情况下工作得很差"，所以所谓的"纯 vibe"根本不存在。

Cohen 自己的工作方式是：先和 AI 对话审计代码库，讨论问题，然后再让 AI 执行。他描述用"Ask mode"来回讨论、纠正 AI 的"谄媚倾向"，然后才让 AI 动手。

这就像和初级开发者 code review 一样------你不会让他闭着眼睛写完再改，而是一边讨论一边迭代。

Agentic Engineering：比 vibe coding 更严肃的层次

Stephanie Zhan 在 X 上提出了一个有意思的区分："Vibe coding 提高了下限，Agentic engineering 提高了上限。"

我自己的感受也是如此。Vibe coding 适合快速原型和内部工具，但到了认证、支付、合规数据的场景就危险了。AI 生成的代码安全漏洞率是人类代码的 2.74 倍，OWASP Top 10 测试的失败率是 45%。

Agentic engineering 的核心区别在于：你不再只是"接受所有"，而是设计 agent 的工作框架。

具体来说：

写 CLAUDE.md / AGENTS.md------给 agent 定义项目上下文、编码规范、约束条件
设计 Harness------工具组合、上下文策略、错误恢复
设定验证流程------agent 每完成一个 milestone，必须跑 lint、typecheck、测试
管理 Durable Memory------用 Markdown 文件维护项目的持久状态，agent 跨 session 不失忆

Notion 联合创始人 Simon Last 的说法很到位："我的工作很大一部分是让尽可能多的 Claude Code 实例保持忙碌。"

从 vibe coding 到 agentic engineering，开发者的角色从"写代码的人"变成了"设计 AI 工作流的人"。

图片来源：www.anthropic.com/engineering...

五、安全：自主编程的达摩克利斯之剑

让 AI 在你的代码库里自主行动，安全问题是绕不开的。Anthropic 自己的红队测试数据很说明问题。

钓鱼攻击：25 次尝试，24 次成功

Anthropic 做了一个红队实验：一名研究员钓鱼了一名员工，让他粘贴了一个恶意 prompt。这个 prompt 让 Claude 窃取了 ~/.aws/credentials。

结果是：25 次尝试中，Claude 完成了 24 次窃取。

模型层面的防御完全无效。唯一有效的办法是环境层面的控制------egress 屏蔽、文件系统隔离。

权限审批疲劳：93% 的通过率

Claude Code 默认所有写操作都需要用户批准。但数据显示，用户批准了 93% 的权限请求。这就是审批疲劳------弹窗太多，用户就不看了。

Anthropic 的解决方案是在 OS 层面加沙箱（macOS 的 Seatbelt，Linux 的 bubblewrap），默认允许读、写限于工作区、网络默认禁止。这让权限弹窗减少了 84%。

白名单反而成为攻击面

一个更隐蔽的攻击：恶意文件指示 Claude 读取敏感文件，然后通过 Anthropic Files API 上传到攻击者的账号。因为 API 域名在白名单里（api.anthropic.com），流量顺利通过。

修复方案是在 VM 内部部署防御性中间人代理，只放行带有 VM 自己 session token 的请求，拒绝攻击者嵌入的 API key。

Anthropic 的总结很精辟："白名单不是目的地过滤器，是能力授予。"

确定性边界才是一切概率性防御失败后的最后一道墙。环境层先做隔离，模型层再做引导。

图片来源：www.anthropic.com/engineering...

六、开发者的新技能树

当 AI 能自主写代码了，开发者需要什么新技能？

这不是一个理论问题。Gartner 预测到 2026 年底，75% 的开发者会花更多时间在编排和架构上，而不是直接写代码。初级开发者需求在认真部署了 AI 工具的公司里下降了 40%。

你不再写代码，你写规范

OpenAI Codex 长期任务实验最成功的一个因素不是模型能力，而是四个 Markdown 文件：

Prompt.md------规格说明 + 交付物定义
Plan.md------里程碑 + 验收标准
Implement.md------执行指令，告诉 agent 怎么操作
Documentation.md------状态追踪 + 决策记录

这四个文件就是"代码"的新形式。你不再写 if-else，你写"什么算完成"。

Anthropic 自己的做法类似------他们用 CLAUDE.md 作为项目记忆，把编码规范、约束条件、架构决策写进去。这个文件不是给人看的，是给 AI 看的。

你不再调试代码，你调试 AI

当 AI 在 loop 里反复犯错，你需要的不是逐行看代码，而是理解 AI 为什么做了错误的决定。

是上下文不够？是工具描述不清楚？是规划出了问题？Martin Fowler 在他的 Structured Prompt-Driven Development 文章里提出了类似的观点：prompt 的质量决定了输出的质量，就像 API 设计的质量决定了使用者的体验。

Cursor 的发现也印证了这点。他们优化 agent 的方式不是让模型更强，而是优化工具定义------改参数名、加示例、修描述，让模型更容易理解怎么用工具。他们在 SWE-bench agent 上"花在优化工具上的时间比优化 prompt 还多"。

你不再单打独斗，你编排团队

Anthropic 内部最先进的用法是"multi-Claude 工作流"。产品经理 Cat Wu 说她的甜点是同时跑 2-4 个 Claude Code 实例。工程师 Jacqueline Lee 更进一步------通过 Slack 触发 Claude，不需要任何看护或引导。

OpenAI Codex 支持 max_threads: 6 的并发 agent。你可以同时让 6 个 agent 做不同的事。

开发者的新技能树是：写规范 > 调试 AI > 编排团队。从代码作者变成了 AI 的技术经理。

开发者新技能树信息图

七、这不是终点

说了这么多，我不想留一个"AI 即将取代程序员"的印象。真实情况比这复杂得多。

还不靠谱的地方

幻觉和过度自信：agent 会信心十足地做错误的决定。Anthropic 的数据显示，auto mode 捕获了约 83% 的过度行为，但仍有约 17% 溜过去
状态丢失：agent 在跨 context window 时容易丢失之前的工作记忆。这就是为什么 Anthropic 要做 Compressor wU2 和 Durable Project Memory
安全漏洞：2.74 倍于人类代码的安全漏洞率不是小事。在认证和支付场景下，vibe coding 是灾难
宏观生产力悖论：Goldman Sachs 的数据显示，AI 投资占美国 GDP 的 0.8%，但宏观层面的生产力增长"基本为零"。历史上的类比：工厂电气化从采用到可测量的生产力提升花了 30-40 年
生产力幻觉：METR 的一项研究发现，开发者使用 AI 工具时"估计自己快了 20%，但实际慢了 19%"------感知与现实的差距接近 40%。fast.ai 的 Rachel Thomas 借用了 Csikszentmihalyi 的概念，称之为"dark flow"和"junk flow"------看起来像心流，其实是上瘾
认知疲劳：Simon Willison 描述自己的体验------"我可以同时开四个 agent 并行工作......但到上午 11 点，我一天就废了。"还有人说传统编程能干"八九个小时的正常产出"，agentic 编程只能撑"四五个极度紧张的小时，然后大脑就彻底煮了"

真正的变化

但有一点是确定的：编程的交互单位已经从"代码行"变成了"任务"。

以前你和 AI 的对话是"帮我补全这个函数"。现在你跟它说的是"帮我重构这个模块"、"从这个 issue 创建一个 PR"、"给这个项目加个认证系统"。

这不是一个渐进的变化。这是从手动挡到自动挡------你还在开车，但你的脚不再踩离合器了。

Bram Cohen 有一句话我特别认同："糟糕的软件是你自己选的。你需要为此负责。你应该做得更好。"

AI Loop 不会自动产出好代码。它只是把能力的天花板提高了。能不能触及那个天花板，取决于你愿不愿意从一个"写代码的人"变成一个"设计 AI 工作流的人"。

有一句话说得好：agentic code is "free as in puppies"------生成很便宜，但养起来很贵。Mo Bitar 写了一篇文章"After Two Years of Vibecoding, I'm Back to Writing by Hand"，在 Hacker News 上拿到 865 分。他的核心观察是："Agent 写的变更单元，孤立地看是好的。它们与自身和你的 prompt 一致。但对整体的尊重，没有。"

这话扎心，但真实。

说实话，我自己也还在适应这个转变。有时候写 CLAUDE.md 的时间比写代码还多，我就会想------这真的更高效吗？

但当 Claude Code 在凌晨三点替我修完了一个困扰了两天的 bug，跑完测试，提了 PR，而我正在睡觉的时候......我就知道，这个方向是对的。

方向是对的，但路还长。

参考资料

Anthropic Engineering Blog: How we contain Claude across products --- www.anthropic.com/engineering...
Anthropic Engineering Blog: Building effective agents --- www.anthropic.com/research/bu...
Anthropic Engineering Blog: Claude Code best practices for agentic coding --- code.claude.com/docs/en/bes...
Anthropic Engineering Blog: Harness design for long-running application development --- www.anthropic.com/engineering (Mar 24, 2026)
Anthropic Engineering Blog: Building a C compiler with a team of parallel Claudes --- www.anthropic.com/engineering...
Anthropic Engineering Blog: Harness design for long-running application development --- www.anthropic.com/engineering...
Anthropic Engineering Blog: Effective harnesses for long-running agents --- www.anthropic.com/engineering...
Anthropic Engineering Blog: Effective context engineering for AI agents --- www.anthropic.com/engineering...
Anthropic Engineering Blog: How we built Claude Code auto mode --- www.anthropic.com/engineering...
Anthropic Engineering Blog: Beyond permission prompts --- www.anthropic.com/engineering...
Anthropic News: Claude Code Security --- www.anthropic.com/news/claude...
Claude Code Official: How Claude Code Works --- code.claude.com/docs/en/how...
OpenAI Developers Blog: Run long horizon tasks with Codex --- developers.openai.com/blog/run-lo...
OpenAI: Introducing the Codex app --- openai.com/index/intro...
PromptLayer Blog: Claude Code: Behind-the-scenes of the master agent loop --- blog.promptlayer.com/claude-code...
ZenML: Claude Code Agent Architecture --- www.zenml.io/llmops-data...
Coder Blog: How AI Agents Are Redefining Developer Workflows at Anthropic --- coder.com/blog/inside...
Cursor Blog: Continually improving agent harness --- www.cursor.com/blog/contin...
Cursor Blog: Bootstrapping Composer with autoinstall --- www.cursor.com/blog/bootst...
Cognition AI: Devin SWE-bench Technical Report --- www.cognition.ai/blog/swe-be...
Cognition AI: Introducing Devin --- www.cognition.ai/blog/introd...
Cognition AI: Closing the Agent Loop --- www.cognition.ai/blog/closin...
Cognition AI: Don't Build Multi-Agents --- www.cognition.ai/blog/dont-b...
Cognition AI: Multi-Agents: What's Actually Working --- www.cognition.ai/blog/multi-...
Cursor Blog: The Third Era of AI Software Development --- www.cursor.com/blog/third-...
Cursor Blog: Cloud Agent Lessons --- www.cursor.com/blog/cloud-...
Martin Fowler: Structured Prompt-Driven Development --- martinfowler.com/articles/st...
First Line Software: AI Software Development 2026-2035 --- firstlinesoftware.com/blog/ai-sof...
Arman Hezarkhani on X: "Agents have three parts: trigger, loop, tools" --- x.com/ArmanHezark...
Stephanie Zhan on X: "Vibe coding raised the floor. Agentic engineering raises the ceiling." --- x.com/stephzhan/w...
Bram Cohen: The Cult of Vibe Coding Is Insane --- bramcohen.com/p/the-cult-...
Karpathy 的 vibe coding 原始推文 --- x.com/karpathy/st...
dbreunig: 10 Lessons for Agentic Coding --- www.dbreunig.com/2026/05/04/...
Pragmatic Engineer: When AI writes almost all code --- newsletter.pragmaticengineer.com/p/when-ai-w...
Mo Bitar: After Two Years of Vibecoding, I'm Back to Writing by Hand --- atmoio.substack.com/p/after-two...
Rachel Thomas / fast.ai: Breaking the Spell of Vibe Coding --- www.fast.ai/posts/2026-...
Simon Willison: Vibe coding and agentic engineering are getting closer than I'd like --- simonwillison.net/2026/May/6/...
Boris Cherny on Lenny's Newsletter: Head of Claude Code on what happens when coding is solved --- lennysnewsletter.com/p/head-of-c...
Gabriella Gonzalez: Beyond Agentic Coding --- haskellforall.com/2026/02/bey...
Maggie Appleton: Gas Town's Agent Patterns, Design Bottlenecks, and Vibecoding at Scale --- maggieappleton.com/gastown

话题标签：#AI编程 #AIAgent #ClaudeCode #自主编程 #VibeCoding #AgenticEngineering #开发工具 #范式转移