过去很多年,我们讨论研发协作,常见的框架无非两种:瀑布流,或者敏捷。
落到执行层面,分工方式也很稳定:产品提需求,设计出稿,前后端开发实现,测试提缺陷,研发修复,最后上线交付。这个模式在传统手工编码时代非常合理,因为代码是靠工程师一行一行写出来的,研发天然就是整个交付链路里唯一的实现中心。
但进入 Vibe Coding 之后,这个前提已经开始松动了。
今天很多项目里,真正稀缺的能力,已经不再是"谁来写出第一版代码",而是"谁能把 AI 生成的系统持续拉到可交付状态"。第一版往往出来得很快,真正拖慢项目的,反而是后面的反复修正、边界补洞、体验打磨、缺陷回归和上线验收。
问题也就出在这里。
如果团队分工还停留在旧时代,那么 AI 提升的只是局部生成速度,却没有缩短整条协作链路。最后常见的结果不是效率翻倍,而是沟通轮次变多、返工次数变多、责任边界变模糊,甚至把 AI 带来的收益重新吃掉。
所以,Vibe Coding 下更适合的研发组织方式,不应该再沿用"产品---开发---测试"的串行接力,而应该拆成三个更贴近实际产出的阶段:
设计(Design) → 实现(Build) → 校准(Calibration)
这不是换个名字那么简单,而是把研发体系从"按岗位分工",调整为"按价值流分工"。
一、为什么传统分工开始失效
先看一个事实变化:
在传统开发里,代码编写本身是主要成本,所以开发环节最重,其他岗位围绕开发协同。
但在 Vibe Coding 里,第一版代码的产生成本被大幅压缩,系统很快就能"看起来能跑起来"。于是项目的主要矛盾发生了转移:
- 不是没有代码
- 不是写不出页面
- 不是接口搭不起来
而是:
- 需求有没有被准确压缩成 AI 能稳定执行的输入
- 生成出来的结构是否可持续维护
- 缺陷是否能快速被发现、描述、修正和验证
- 项目是否能从"能运行"真正走到"能交付"
这意味着,过去那种以"编码"为中心的组织方式,开始出现几个明显问题。
1. 第一版很快,后续却很慢
AI 可以迅速给出首版系统,但首版并不等于成品。真正耗时的,通常是后续大量细碎而高频的调整:文案不准、状态不对、交互不顺、边界漏判、异常没兜住、接口口径不一致、组件行为跑偏。
这些问题如果还沿用"测试提单---研发修复---测试回归"的传统流程,沟通链路会被迅速拉长。
2. 问题不是写出来,而是收敛下来
AI 生成最大的优势是速度,最大的风险是随机性。
同样一句提示,不同轮次可能生成不同实现;同样一个局部修改,也可能误伤其他模块。于是团队真正需要的,不只是生产代码,而是建立一套能持续收敛偏差的机制。
3. 岗位职责还在旧世界,协作成本却进了新世界
如果每一个细小问题都要在产品、研发、测试之间往返流转,AI 提升的只是单点产能,不是系统效率。最终你会发现:代码生成速度上去了,但组织吞吐量没有上去。
所以,Vibe Coding 不是简单地"让开发更快",而是逼着团队重新定义谁负责什么。
二、比起"谁写代码",更重要的是"谁让系统交付"
如果把整个研发过程重新拆开,会发现更合理的分层其实是这三段:
- 设计:把模糊需求压缩成稳定输入
- 实现:把输入变成整体可运行的系统
- 校准:把能跑的系统拉到可交付状态
这三段并不是三道互相甩锅的工序,而是一条连续的收敛链路。
从这个视角看,团队里每个岗位的价值也会重新排序。
三、第一阶段:设计不是画图,而是降低生成随机性
在 Vibe Coding 里,设计阶段最重要的工作不是把页面"画漂亮",而是把需求整理成AI 和人都能稳定执行的输入。
谁离业务目标最近,谁就最适合主导这一阶段。这个角色通常还是产品经理。
因为产品经理最清楚:
- 系统到底要解决什么问题
- 哪些功能优先级最高
- 哪些业务规则不能出错
- 哪些边界场景一旦遗漏就会出事故
- 什么才算真正验收通过
在这个阶段,设计质量直接决定后面生成质量。前面写得越清楚,后面偏差就越少;前面约束越扎实,后面返工就越低。
设计阶段真正要产出的,不是"文档",而是"稳定输入"
一个可用于 Vibe Coding 的设计阶段,至少要沉淀出四类内容:
1. 功能规格说明
包括:
- 模块目标
- 核心业务规则
- 输入与输出
- 异常处理
- 数据口径
- 验收标准
这部分不是为了"写文档交差",而是为了让后续实现和校准都有共同参照。
2. 可预览的 UI 原型
这里我非常赞成一个关键做法:尽量把页面原型直接做成 HTML 格式,而不是只停留在图片稿。
原因很现实。
静态图只能表达样子,HTML 原型更容易表达:
- 页面结构
- 组件层级
- 状态切换
- 动效意图
- 交互路径
- 提示文案
它既方便产品自己确认,也方便研发在实现阶段把它作为页面生成参考。相比只给一张视觉稿,HTML 原型能明显降低 AI 在页面实现上的跑偏概率。
3. 页面与交互说明
除了原型本身,还需要补上文字说明,尤其是:
- 页面入口和出口
- 关键按钮行为
- 状态变化条件
- 异常提示
- 空状态、加载态、失败态
- 权限差异和角色差异
很多项目不是做不出页面,而是页面"长得像",行为却不对。问题往往就出在这一层没写实。
4. 验收口径
没有验收口径,就没有真正意义上的"完成"。
要明确:
- 哪些结果算通过
- 哪些问题必须修
- 哪些偏差可以接受
- 哪些指标必须达标
- 哪些场景必须覆盖
对于 Vibe Coding 来说,验收标准不是结尾才需要的东西,而是前置约束。
设计阶段的目标,只有一个
把模糊需求变成稳定输入,把后续生成的不确定性尽量消灭在源头。
这一步做得越扎实,后面的实现就越不是"碰运气"。
四、第二阶段:实现不只是生成代码,而是搭建受约束的生成流水线
很多人理解 Vibe Coding,会把实现阶段简单看成"让 AI 开始写代码"。
这其实低估了实现阶段的难度,也误解了研发在这个时代的价值。
因为 AI 能生成大量代码,不代表项目就会自然成型。真正决定系统质量的,仍然是这些工程层判断:
- 技术栈怎么选
- 模块边界怎么划
- 状态和数据流怎么组织
- 接口和领域模型怎么定义
- 错误兜底怎么做
- 公共能力怎么沉淀
- 后续修改边界怎么约束
所以,实现阶段依然更适合由研发主导。只是研发的角色已经不再只是"写代码的人",而是系统生成方式的设计者。
实现阶段的核心,不是直接开写,而是先把生成过程流程化
比较成熟的做法,是走一套 spec-driven development 的工作流:先把规格、约束、计划和任务边界立住,再进入生成。
你提到的 spec-kit 思路就很适合放在这里。
它的价值在于:把原本一次性、易漂移的提示词,变成一组可以复用、可以继承、可以被后续引用的工程文档。
可以把这条链路理解成六步。
1. Constitution:先定宪章
先明确哪些原则不能碰,例如:
- 架构边界
- 命名规范
- 代码组织方式
- 质量门槛
- 安全要求
- 兼容性要求
- 可观测性要求
这一步相当于给 AI 先划红线。
2. Specify:把需求结构化
把业务需求转成结构化规格,明确:
- 用户故事
- 功能边界
- 输入输出
- 关键流程
- 验收标准
3. Clarify:把歧义提前问清楚
尽量在写代码之前,把模糊点、冲突点和缺失点解决掉。越早澄清,后面代价越低。
4. Plan:形成实现计划
这里不只是"准备怎么做",而是把核心工程决策写实,包括:
- 模块结构
- 技术方案
- 数据模型
- 接口约束
- 权限策略
- 异常路径
- 日志与监控方案
5. Tasks:拆成明确任务单元
目的是为后续实现和校准建立修改边界,让每一块都知道"谁负责、改到哪、什么算完成"。
6. Implement:最后才进入代码生成
到了这一步,AI 才开始真正落代码,而不是一上来就靠一句大提示"帮我写个系统"。
为什么实现阶段仍然要由研发主导
因为真正的工程风险,不在"能不能生成代码",而在"生成出来之后会不会把团队拖死"。
研发在这个阶段的价值,已经从"手写所有细节"转向了几件更重要的事:
- 定技术边界
- 控结构复杂度
- 保后续可维护性
- 给校准阶段留下可操作的修改空间
- 在 AI 失控时,知道应该往哪里拉回来
换句话说,研发不再是唯一生产者,但仍然是最关键的技术中枢。
五、第三阶段:校准,才是 Vibe Coding 下最容易被低估的主战场
如果说设计决定方向,实现决定骨架,那么校准决定项目能不能交付。
因为 AI 时代最常见的情况,不是"什么都没有",而是"已经有了一个差不多能用的系统"。真正花时间的,是把这个"差不多"不断往"可以上线"推进。
这包括:
- 功能测试
- 缺陷复现
- 局部修改
- 提示修正
- 体验补齐
- 文案打磨
- 边界清理
- 回归验证
这也是为什么我非常认同:校准应该被单独拆出来,而且可以由测试主导。
为什么校准适合测试来主导
传统模式下,测试发现问题,提交给研发,研发修完,测试再验证。这套流程在手工编码时代是合理的,因为修复只能由研发完成。
但在 Vibe Coding 场景下,很多局部问题并不一定非得由研发亲自改。
测试本来就擅长几件事:
- 发现偏差
- 描述偏差
- 复现偏差
- 判断偏差是否被修正
- 做回归验证
而校准阶段的本质,恰恰就是持续发现偏差、描述偏差、修正偏差、再验证偏差。
从语言形态上看,测试提 bug 和校准提示词其实非常接近。它们都在回答同一类问题:
- 哪里不对
- 怎么复现
- 期待结果是什么
- 实际结果是什么
- 应该修到什么程度
这使得测试天然适合进入"直接与 AI 协作修正问题"的位置。
为什么把校准交给测试,反而可能更高效
因为这样可以直接砍掉大量无效沟通。
传统链路是:
测试发现问题 → 提单 → 研发理解 → 研发修改 → 测试回归
而在校准模式里,可以变成:
测试发现问题 → 直接结合上下文和 AI 修正 → 回归验证 → 必要时再升级给研发
只要实现阶段已经把上下文铺好,测试拿到的不应该只是一个仓库,而应该是一套完整的修改约束:
- UI 原型
- 功能规格
- 接口约定
- 计划文档
- 任务边界
- 架构约束
- 代码风格约束
有了这些,测试做的就不是"乱改代码",而是在明确边界内做问题收敛。
什么时候测试能自己收,什么时候必须回到研发
这里很关键。校准能由测试主导,不代表所有问题都适合测试独立处理。
可以简单分成两类:
适合在校准阶段直接收掉的问题
- 文案错误
- 样式偏差
- 页面状态缺失
- 表单校验问题
- 明确的交互缺陷
- 局部接口适配问题
- 已知规则下的边界补齐
- 单页面或单模块内的细小逻辑修正
应该升级给研发的问题
- 跨模块结构冲突
- 数据模型设计错误
- 技术方案需要调整
- 状态管理架构不合理
- 接口协议本身不成立
- 权限体系设计问题
- 公共组件或基础能力缺陷
- AI 修改开始出现大面积失控
一句话概括:
局部偏差,校准收敛;结构问题,研发兜底。
六、研发、产品、测试三种角色,会怎样重新站位
在这种分工下,三个岗位的定位会发生明显变化。
产品经理:从"提需求的人"变成"输入设计者"
产品经理不再只是负责写 PRD,而是负责把业务目标压缩成 AI 和团队都能执行的稳定输入。
产品阶段做得越扎实,后面整个系统的随机性就越低。
研发:从"生产主力"变成"技术中枢"
研发依然关键,但关键点变了。
他的核心职责不再是自己把所有代码写完,而是:
- 选择技术栈
- 搭结构
- 立约束
- 设计生成路径
- 把公共能力先沉下来
- 在系统偏离结构时负责拉正
测试:从"问题转发者"变成"校准推进者"
测试不再只是缺陷的发现者,而成为系统交付阶段真正的推进者。
他们既做验证,也做收敛;既发现问题,也在边界内推动问题被直接消化掉。
七、真正值得调整的,不只是流程,而是团队配置
如果这套方式跑通,团队配置也不必再沿用过去那种"一条需求线配一套产品、研发、测试"的平铺模式。
传统模式里,常见是:
- 1 个产品
- 1 个前后端开发
- 1 个测试
每条线都复制一套人力,线性扩张。
但在 Vibe Coding 下,更可能出现的,是一种中枢式配置:
- 少量产品经理,负责需求压缩和规格定义
- 少量核心研发,负责技术底座和生成约束
- 更多测试,负责并行校准和交付推进
也就是说,团队的并行能力,未来未必主要来自研发人数,而可能主要来自测试侧的校准吞吐量。
一个更接近未来的组织方式
例如:
- 2 个产品经理
- 1 个核心全栈 / 技术负责人
- 8 个测试 / 校准执行者
这里的核心开发不是被削弱了,而是角色升级了。他不再作为每条需求线上的"人工编码器",而是作为整个技术系统的设计者和纠偏者存在。
而测试则成为并行推进的主力:
- 按模块推进
- 按页面推进
- 按业务流程推进
- 一边验证,一边修正,一边回归
这样一来,组织吞吐量就不再被研发人数死死卡住。
八、这套模式真正改变的,是"生产关系"
很多人谈 Vibe Coding,容易把注意力放在工具层:模型更强了,生成更快了,IDE 更智能了,脚手架更高级了。
这些当然重要,但还不够。
因为软件研发从来不是单点工具问题,而是一个生产体系问题。
过去软件研发的生产力,主要取决于:
- 研发个人编码速度
- 团队人力投入
- 协作效率
而现在,AI 已经把"代码生成能力"整体抬高了一个数量级。很多原来要靠多人、多轮才能完成的实现动作,已经可以通过工作流和约束文档快速产出。
但这不意味着结果一定更好。
真正决定这波能力能不能释放出来的,不是模型演示效果,而是团队的生产关系有没有同步变化:
- 谁定义输入
- 谁控制结构
- 谁负责收敛
- 谁在什么边界内修改
- 问题如何回流
- 什么情况升级
- 谁对最终交付负责
如果这些关系不变,那么 AI 带来的速度提升,大概率会被以下成本吞掉:
- 沟通成本
- 返工成本
- 责任割裂
- 上下文丢失
- 多轮往返
- 局部优化带来的系统失真
所以,Vibe Coding 时代最本质的问题,从来不是"会不会生成代码",而是:
当生产力已经跃迁之后,组织有没有能力重新组织生产关系。
九、和传统模式的差异,可以归纳成这张表
| 维度 | 传统研发模式 | Vibe Coding 模式 |
|---|---|---|
| 主要瓶颈 | 编码产能不足 | 交付收敛速度不足 |
| 开发角色 | 主要实现者 | 技术中枢与结构控制者 |
| 测试角色 | 提 bug、做回归 | 直接参与校准与问题收敛 |
| 产品角色 | 提需求、写文档 | 设计稳定输入与验收约束 |
| 协作方式 | 串行接力 | 连续收敛 |
| 文档作用 | 辅助沟通 | 直接约束 AI 生成与修改 |
| 第一版代码 | 相对较慢 | 通常很快 |
| 真正耗时阶段 | 实现 | 校准 |
| 组织并行能力来源 | 研发人数 | 测试侧校准吞吐量 |
结语
Vibe Coding 的意义,不只是让代码写得更快。
更大的变化在于,软件研发这件事的主战场已经变了。过去比的是谁写得快、谁堆的人多;现在越来越比的是谁能把需求压缩得更准、把系统结构搭得更稳、把交付过程收敛得更快。
所以,研发体系也必须跟着变化。
真正有竞争力的团队,不会停留在"让 AI 帮开发写代码"这一步,而会继续往前走:把设计、实现、校准三段重新组织起来,把产品、研发、测试之间的职责重新分配,把原本依赖个人经验的动作沉淀成可复用的工作流和约束体系。
到那时,Vibe Coding 才不只是一个演示能力,也不只是几个聪明人的效率工具。
它会变成一套真正稳定、可复制、可放大的生产体系。