AI Coding 协作实践方案

为什么现在值得做

我们先不谈模型能力,先看研发日常。

前后端同事每天真正花时间的地方,很多并不是业务判断本身,而是这些动作:

  • 找代码入口
  • 看调用链
  • 补样板代码
  • 查错误日志
  • 写测试
  • 写 PR 描述
  • 在 IDE、终端、代码平台、文档平台之间切换

这些事情单看都不难,但它们会不断打断主线任务。GitHub 的开发者反馈里有一个判断很值得借用:好的 AI 工具,最直接的价值不是替代开发者,而是减少上下文切换,帮开发者把判断权留下来。

以后这些打断型动作,尽量先交给 AI 处理。


先试什么

不要一开始就挑战最高难度。第一波试点一定要选那些"能看懂结果、能快速验证、风险可控"的任务。

前端适合先试的场景

  • 解释路由、页面状态流和调用链
  • 根据已有页面模式补组件骨架、请求层和类型
  • 生成复杂页面的回归清单
  • 根据已有改动生成 PR 摘要和风险说明

后端适合先试的场景

  • 解释 controller、service、repository 之间的数据流
  • 根据已有模式补 handler、DTO、校验和单测
  • 排查接口异常、事务问题、序列化问题
  • 生成接口文档、迁移说明和回滚说明

第一波不要硬推的场景

  • 没有测试兜底的核心模块重构
  • 权限、安全、资金链路的自动改动
  • 一次跨多个系统的大范围联动修改
  • 需求和完成标准还没讲清楚的任务

Vercel 的经验很明确:当前最容易成功的 agent 场景,仍然是低认知负担、高重复、流程稳定的工作


主流程

下面这一段,是最核心的内容。

flowchart LR A[定义任务] --> B[计划分析] B --> C[小步实现] C --> D[自检验证] D --> E[人工Review] E --> F[Git提交与PR] F --> G[复盘沉淀] G --> H[逐步自动化]

第一步:定义任务

任何任务开始前,先把输入补齐。最少要有四段:

  • Goal
  • Context
  • Constraints
  • Done when

这一步的作用非常简单,就是减少 AI 自己脑补。Codex 官方把这四段结构明确当成默认输入方式。

如果人自己都讲不清楚要改什么,就不要期待 AI 能稳定地改对。

第二步:计划分析

复杂任务先进入 Plan Mode,只读分析,不直接改代码。涉及以下情况时,这一步不要省:

  • 多文件改动
  • 跨模块联动
  • 缓存、权限、事务、状态管理
  • 老代码重构
  • 构建链路或数据库变更

这一阶段只要求 AI 回答三件事:

  1. 影响范围是什么
  2. 风险点是什么
  3. 验证方式是什么

如果这三件事说不清楚,就先别进入实施。

第三步:小步实现

编码阶段不要追求"这一轮全部做完",而是要追求"这一轮做一个清晰子任务"。比如:

  • 只补一个 store 的持久化
  • 只修一个接口错误分支
  • 只补一组单测
  • 只改一个页面请求链路

不是 AI 一次改得越多越厉害,而是一次改得越清楚越可靠。

第四步:自检验证

代码改完先别急着 commit。先让 AI 交代清楚:

  • 改了哪些文件
  • 为什么改这些文件
  • 还缺哪些验证项
  • 风险最高的是哪里

然后跑最小测试集、最小 lint 或最小类型检查。Simon Willison 也提到,coding agent 表现稳定的关键,往往是自动化测试、开发服务器、lint、类型检查和更详细的错误信息,而不是把 prompt 写得越来越长。

第五步:人工 Review

AI 可以把 review 前移,但不能替代最终 review。这里最建议统一一个最小 review 口径:

  • 是否符合仓库规则
  • 是否复用了已有模式
  • 是否引入重复实现
  • 是否有高风险但未验证的改动
  • 是否补齐必要说明

第六步:Git 提交与 PR

到了这一步,AI 最适合帮忙做的是:

  • 生成 commit message 候选
  • 生成 PR 标题
  • 输出变更摘要
  • 列出影响范围
  • 写验证方式
  • 写风险与回滚点

第七步:复盘沉淀

如果一类任务反复出现,就不要每次重新口述,而要开始沉淀:

  • 规则文件
  • hooks
  • skills
  • review 清单
  • 自动化流程

这一步不是附属动作,而是团队 AI 收益能不能累积的关键。


关键功能应该怎么讲

这部分最容易讲乱,因为名词很多。建议你不要按产品介绍,而是按"这些功能分别解决什么问题"来讲。

flowchart TD A[规则文件] --> A1[定义项目规则] B[Plan Mode] --> B1[先分析再实施] C[MCP] --> C1[读取仓库外事实] D[Hooks] --> D1[强制执行固定动作] E[并行会话] --> E1[隔离不同任务上下文] F[git worktree] --> F1[隔离分支和目录] G[Skills] --> G1[复用高频流程] H[Automations] --> H1[让稳定流程定时运行]

规则文件

规则文件本质上是给 AI 的长期说明书,最适合放:

  • 项目结构
  • 启动命令
  • 构建与测试命令
  • 命名和编码规则
  • review 要求
  • 禁止事项

规则文件就是把"大家默认知道的事"写成"AI 每次都会先知道的事"。

Plan Mode

Plan Mode 只适合做一件事:先理解,再动手。它不是拖慢速度,而是在减少返工。

MCP

MCP 不负责写代码,它负责给 AI 提供仓库外的真实信息,比如:

  • PR
  • Issue
  • 日志
  • 监控
  • 接口文档
  • 知识库

能让 AI 去读事实,就不要让它靠聊天记录猜事实。

Hooks

Hooks 解决的是"哪些动作必须自动执行"(门禁系统)。

例如:

  • PreToolUse 拦截危险命令
  • PostToolUse 自动格式化
  • PermissionRequest 管高风险操作
  • SessionStart 提醒先读规则
  • Stop 做任务结束检查

规则文件告诉 AI 应该怎么做,hooks 负责把一部分动作变成必须做。

并行会话和 git worktree

当团队同时做功能开发、线上 bug、重构探索时,最容易出问题的不是模型能力,而是上下文串线。这里建议直接强调两个原则:

  • 一任务一会话
  • 一高风险任务一 worktree

Skills 和 Automations

如果某类动作已经反复出现,就先做成 skill;如果它已经稳定到不太需要人干预,再做 automation。


Git 落地

新功能

flowchart LR A[切主分支并拉最新] --> B[新建功能分支] B --> C[Plan Mode分析] C --> D[小步实现] D --> E[AI审查暂存区] E --> F[运行最小验证] F --> G[rebase主分支] G --> H[推送分支] H --> I[生成PR描述]

对应命令:

bash 复制代码
git switch main
git pull --ff-only
git switch -c feat/xxx

每完成一个子任务,小步提交:

bash 复制代码
git status
git diff --stat
git add src/a.ts src/b.ts
git commit -m "feat(scope): summary"

提交前让 AI 审查暂存区:

md 复制代码
请审查当前暂存区改动:
1. 说明改动目的
2. 指出潜在风险
3. 列出还缺的验证项
4. 建议 commit message

Bug 修复

Bug 修复时最重要的是复现步骤。

没有复现步骤,就不要期待 AI 稳定修好问题。

示例:

md 复制代码
Bug:保存成功后刷新页面状态丢失。

复现步骤:
1. 启动项目
2. 进入设置页
3. 打开开关
4. 点击保存
5. 刷新页面

要求:
- 先复现
- 先找根因
- 修复后运行最小相关测试
- 输出验证步骤

并行任务

如果团队要同时跑功能、bug 和重构,建议直接上 git worktree

bash 复制代码
git worktree add ../project-bugfix -b fix/bug-x main
git worktree add ../project-refactor -b refactor/module-y main

它的价值:

  • 上下文不串
  • 分支不串
  • 改动不串

回滚

共享分支优先用:

bash 复制代码
git revert <commit_sha>

不要把最危险的命令直接交给 AI。更适合让 AI 做的是:

  • 找问题 commit
  • 分析影响范围
  • 列回滚后的验证清单

自动化作为第二阶段

自动化不是第一波要做的事。第一波只解决"仓库内流程跑顺",第二波才解决"稳定动作自动化",第三波再做"跨系统自动化"。

flowchart LR A[第一阶段 仓库内流程跑顺] --> B[第二阶段 稳定动作自动化] B --> C[第三阶段 跨系统自动化] C --> D[长期运行与定时调度]

怎么理解分层

  • Codex / Claude Code:编码执行层
  • Hermes Agent:自动化调度层
  • dws / lark-cli:协同执行层

也就是说:

  • 写代码、跑测试、做 review,还是交给擅长代码的 agent
  • 长期运行、定时任务、跨平台分发,可以交给 Hermes Agent
  • 真正落到钉钉、飞书的消息、日历、待办、文档、会议,再交给官方 CLI 去执行

例如:

  1. Hermes Agent 定时扫描最近合并的 PR
  2. 调用 CodexClaude Code 生成变更摘要和风险项
  3. 再通过 dwslark-cli 发到研发群、写待办或生成周报提醒

前后端团队先把代码内工作流跑顺,再考虑跨系统自动化,成功率会高很多。


收尾

团队真正需要统一的,不是"大家都用哪个模型",而是"大家按照什么顺序把 AI 接入现有工程流程"。

定义任务 -> 计划分析 -> 小步实现 -> 自检验证 -> 人工 review -> Git 提交与 PR -> 复盘沉淀 -> 再逐步自动化

只要这条顺序跑顺,AI 带来的收益就不只是"写得更快",而是:

  • 找代码更快
  • 改动更稳
  • review 更清晰
  • 提交更规范
  • 信息同步成本更低

相关推荐
KevinWang_2 小时前
AE 基本操作
程序员
2601_961875242 小时前
花生十三公考课程|网课|视频
数据库·windows·git·svn·eclipse·github
带娃的IT创业者5 小时前
GitHub 热门: coleam00/Archon —— 当 AI Agent 学会自我进化
人工智能·github·开源项目·ai agent·智能体·自我进化
lpfasd1235 小时前
2026年第24周GitHub趋势周报
github
江畔柳前堤6 小时前
github实战指南03-Pull Request 全流程实战
开发语言·人工智能·python·深度学习·github·word
EleganceJiaBao6 小时前
【Git】Git reset 完整指南:真正理解 HEAD、暂存区与工作区
git·github·reset
爱勇宝6 小时前
CEO通知5100名员工:今年不涨薪了,钱要投给AI!
前端·后端·程序员
字节跳动数据库7 小时前
文章分享——好代码 - 半点没用的话题
人工智能·程序员
AskHarries7 小时前
手写一个最小 Agent
程序员