Hello,我是Niko。16年程序员老兵,专注分享 AI编程实战经验、宝藏工具资源、前沿技术动态。不玩套路,多讲干货。
最近重读 Peter Pang 那篇《Why Your "AI-First" Strategy Is Probably Wrong》。25 人的公司,10 个工程师,99% 的生产代码由 AI 写,每天部署 3 到 8 次。新功能上午上线、下午砍掉、晚上换个更好的版本------三个月前同样的事要走六周。
这种节奏不是装了 Copilot 就能出来的。结合我在公司和身边朋友的实际情况,最大的感受是:国内绝大部分喊"我们也要 AI First"的企业,应该先把这篇文章逐字读三遍。
我想聊的不是这套方案怎么实现,而是把它当成一面镜子,照一照国内企业 AI 编程落地的真实样子------为什么大多数公司还没开始就已经走错了。
太长不看版
- 国内企业 AI 编程落地的第一站,不是提效,是混乱(Chaos)。不破不立,但破坏后的重建,不是所有企业都有这种能力。
- 把 AI 工具塞进开发流程不是 AI First,是 AI 辅助。即便程序员完全不再手写代码,加速的也只是"写代码"这一个小环节。
- AI First 带来的真正变化有三个:代码仓库的组织方式、公司的组织结构、开发流程的设计。少一个都跑不起来。
- 架构师是这套体系里最稀缺的角色,市场上也是。没有多少可借鉴的经验时,个人的判断力和批判性思考反而比技术栈更值钱。
- "运营者"是围绕 AI 工作的所有人------他们的工作变成了满足 AI 的任务和要求。
- 不会因为工程师在生产环境引入漏洞就解雇他们,而是去完善流程。这和 Claude Code 源码泄露后 Anthropic 的处理思路一致。
- AI 提效的部分会叠加,但新瓶颈一定会冒出来。最终能提效到什么程度,由人来制约------具体是由那个最不愿意改流程的人来制约。
- 真正的 AI First 是围绕 AI 构建,就像工厂的所有工作和安排都是围绕核心流水线建立。AI 是流水线,不是工人。
落地第一站:不是提效,是一团乱
很多公司一聊 AI First,脑子里浮现的画面是:人少了、提效了、迭代飞快、PR 一晚上合上百个,老板看报表笑得合不拢嘴。
我看到的真实画面不太一样:
- 老的代码仓库改不动,新的代码 AI 写得飞快,两边对不上;
- CI/CD 不全,AI 提交的代码更难人工评审,流程上还需要手动测;
- 测试覆盖率不够,AI 改完一处,QA 上来一句"我不敢说没影响别的功能";
- 流程里每一个原本由人审批的环节都没人敢撤,AI 速度被卡在审批门外;
- 团队里有人激进有人保守,资深工程师自我怀疑,初级工程师跃跃欲试,中层不知道该往哪边站。
这是落地的第一站------Chaos。
破坏旧流程很容易。问问 AI 让它给你写一份"AI 优先的开发流程改造方案",半天就能拿到一份像模像样的 PPT。但破坏之后的重建,不是所有企业都有这个能力。
Peter Pang 在文章里轻描淡写地写了一句"我花了一周设计新系统,再花一周用 AI 重构整个代码库"。听起来很潇洒。但他在文末才说出代价:
"员工的迷茫与焦虑、CTO 每天工作 18 个小时的煎熬、资深工程师对自身价值的自我怀疑,以及那段旧系统已拆毁而新系统还未跑通的、令人窒息的两周真空期。"
国内企业能扛住这两周真空期的,凤毛麟角。多数公司第三天就会开始"先回滚一下,等大家适应了再说"------然后就再也回不去了。
只用AI编码,不叫 AI First
我见过太多团队,老板喊一句"我们要 AI First",第二天给每个工程师批了 Claude 订阅,半个月后开总结会:"效率提升了 20%。"
这叫 AI 辅助,不叫 AI First。
两者的差别:

就算你现在已经完全不手写一行代码,让 AI 写完所有功能,这依然只是 AI 辅助。 加速的只是"代码编写"这一个小环节。从需求到上线,写代码原本就只占整个流程很小的一部分------需求、设计、评审、测试、部署、监控、回滚,哪一环不是人在干?
写代码从两天压到两小时,听起来快了 8 倍。但前面需求评审花了三周,后面 QA 测试花了三天,整体节奏根本不会变。用文中的话说:你只是在离旧瓶颈十英尺远的地方,又建了一个新瓶颈。
真正的 AI First 要改三件东西:
- 代码仓库的组织方式------从分散的多仓库走向 Monorepo,让 AI 能"看见"全局。
- 公司的组织结构------从"工程师 + PM + QA + 架构师"的传统分工,走向"架构师 + 运营者"的二分。
- 开发流程的设计------从"人评审 AI 输出"到"AI 评审 AI 输出,人审战略风险"。
少一个,AI First 就跑不起来。
角色重排:谁变得更值钱,谁变得更焦虑
Peter Pang 把 AI First 组织里的人分成两类:架构师 和运营者。

架构师只有一两个人。他们设计标准作业程序,教 AI 如何工作,构建测试支架和集成系统,拍板系统架构和边界。他们定义在 AI 眼里什么叫"好"。
运营者是其他所有人。他们的工作依然重要,但结构变了------现在是 AI 给人分配任务。分诊系统发现 Bug,创建工单,亮出诊断结果,分配给合适的人。人去调查、验证、批准修复方案。AI 提交代码,人审核风险。
这个分法听起来简单,放到国内企业的语境里,有几个很现实的问题。
架构师是所有企业都稀缺的角色,也是市场上最稀缺的。
这个角色需要的不是写代码的能力------AI 已经能写了。需要的是批判性思维:AI 提出一个方案,你能不能找到它遗漏的失效模式?越过了哪些安全边界?积累了什么技术债?
Peter Pang 说他有物理学博士学位,读博期间学到最有用的东西是"如何质疑假设、给论点做压力测试、寻找逻辑漏洞"。他的判断是:在未来,批评 AI 的能力将比写代码的能力更有价值。
我同意这个判断。补一句:在 AI First 这条路上,没有多少可借鉴的经验。每家公司业务不同、技术栈不同、团队基因不同,你不可能照搬别人的方案。这时候,个人的判断力和批判性思考的能力,比任何技术栈都值钱。
运营者不是"低级工程师",而是围绕 AI 进行工作的人。
换个说法更直白:运营者满足的是 AI 的任务和要求。AI 发现问题、诊断原因、生成工单,运营者去验证和执行。这不是降级,但确实是角色反转------过去是人给机器下指令,现在是机器给人派活。
这种反转对很多资深工程师来说是心理上的暴击。文章里提到一个有意思的现象:初级工程师比资深工程师适应得更快。 没有传统思维定式的人,拿到一个能放大自身影响力的工具,如虎添翼。而花了十几年练就一身手艺的人,发现 AI 一小时就能干完自己两个月的活------这很难接受。
不同职位的价值锚点在发生转移:
| 角色 | 旧价值锚点 | 新价值锚点 |
|---|---|---|
| 高级工程师 | 代码产量、技术深度 | 决策质量、判断力 |
| 产品经理 | 需求文档、规划能力 | 直觉和品位 |
| CTO / 管理层 | 团队管理、资源协调 | 不让流程成为瓶颈和制约 |
最后一条尤其重要。Peter Pang 说他从"管理者"变回了"建造者",每天从早 9 点写代码到凌晨 3 点。传统 CTO 模型里 60% 的时间花在人员管理上------对齐优先级、开会、给反馈、辅导工程师。现在这些事情不到 10%。
对国内的技术管理者来说,这意味着一个很尖锐的问题:如果你的日常工作是开会、对齐、审批,而这些恰好是 AI First 要消灭的瓶颈------你自己就是那个瓶颈。
不解雇引入漏洞的工程师,去完善流程
Peter Pang 文章里有一句话让我印象很深:
"我们不会因为一个工程师在线上写了个 Bug 就开除他。我们会改进审查流程、加强测试、增加护栏。对待 AI 也是一样。如果 AI 犯了错,我们就去构建更好的验证机制、更清晰的约束条件和更强的系统可观测性。"
这让我想起 Claude Code 源码泄露那件事。Anthropic 的处理方式不是追责某个人,而是回头审视整个流程:为什么这个东西能泄露出去?哪个环节缺了防护?怎么让这种事不再发生?
两件事逻辑一样:出了问题不追人,追流程。
放到 AI First 的语境里,这个思路更关键。AI 写的代码一定会出 Bug,一定会引入漏洞,一定会在某个边界条件上翻车。这不是"如果"的问题,是"什么时候"的问题。
你的应对方案如果是"出了事找人背锅",那永远建不起来 AI First 的体系。每个人都会变得保守------不敢让 AI 多做事,不敢减少人工审查,不敢自动化部署。最后 AI 的能力被人为压缩到一个"安全但没用"的范围里。
Peter Pang 的做法是建一套自愈闭环:
- 每天早上 AI 自动扫描 CloudWatch 日志,生成健康报告;
- 一小时后分诊引擎自动聚类错误、评估严重程度、生成调查工单;
- 工程师提交修复后,同一套流水线自动验证,确认修复后工单自动关闭;
- 如果之前关闭的问题又出现了,系统自动检测到回归并重新打开工单。
每个 PR 触发三轮 AI 审查:代码质量、安全漏洞、依赖风险。这不是建议,是拦截关卡------过不了就不能合并。
完善以 AI 为核心的整个流程和审查机制,才是正路。 不是靠人盯着 AI,是靠系统约束 AI。
提效会叠加,但瓶颈永远在
一个容易被忽略的事实:纳入 AI 流程被提效的部分,效果确实会叠加。 AI 写代码快了,AI 审查代码也快了,AI 跑测试也快了------串起来,整体速度确实是指数级提升。
但新瓶颈一定会冒出来。
Peter Pang 自己列了三个:产品管理的瓶颈(PM 花几周做需求,AI 两小时就能实现)、QA 的瓶颈(AI 写代码两小时,QA 测三天)、人力的瓶颈(25 人对抗几百人的竞争对手)。他解决了这三个,但没说的是------解决完之后,下一个瓶颈是什么?
答案是:人。
就是那个做判断的人。架构师的判断速度、产品经理的品位、CTO 对流程的设计能力------这些 AI 目前替代不了,也是整个系统最终的天花板。
AI 能把执行速度拉到极致,但决策速度取决于人。一天部署 8 次没问题,但架构师一天只能审 3 个方案,另外 5 个就得排队。产品经理的直觉跟不上迭代速度,功能上了又砍、砍了又上,快也没意义。
最终提效的程度,还是由人来制约。 更准确地说,是由那个最慢的人------通常也是最不愿意改流程的那个人------来制约。
真正的 AI First 是围绕 AI 构建
写到这里,用一个类比收尾。
想象一家工厂。流水线是核心,所有的工位、物料、质检、仓储、排班,都是围绕流水线安排的。没有人会说"我们先把工人招好,然后看看流水线怎么配合工人"------那不叫工厂,叫手工作坊。
真正的 AI First 是这个逻辑。AI 是流水线,不是工人。
所有的工作和安排------代码仓库怎么组织、PR 怎么审查、测试怎么跑、部署怎么做、监控怎么看、工单怎么流转------都要围绕"让 AI 能高效、安全、可控地工作"来设计。人的角色是设计流水线、维护流水线、在关键节点做质检。
大多数国内企业现在做的事情,是在手工作坊里放了一台机器人,然后让工人教机器人怎么用锤子。机器人确实比人锤得快,但作坊还是作坊。
从作坊到工厂,要改的不是工具,是整个生产方式。
这条路不好走。Peter Pang 用两周真空期、18 小时工作日、团队的焦虑和自我怀疑换来了现在的结果。国内企业要走这条路,挑战只会更多------技术基础设施的欠账、组织惯性的阻力、管理层对"失控"的恐惧。
但方向没有错。每做一个决策的时候,想一想这件事能不能让 AI 来做。如果不能,缺什么条件,怎么把条件补上。 这种意识本身,就是 AI First 的起点。
至于终点------可能不是让 AI 干所有的活,而是借着这股力量,把你一直想做但没动力做的工程改进,真正推动起来。

参考资料: