从“让 AI 写代码”到“把 AI 接入研发流程”:一次 Agentic Coding 实践复盘

过去一段时间,我在一个已有一定规模的前端 / 桌面端项目里持续尝试 Agentic Coding。这里的重点不是"某个模型到底有多聪明",而是:AI 怎样真正进入日常研发流程,并逐步变成团队可以复用的工程能力。

很多人第一次使用 AI 写代码时,习惯把它当成一个更强的问答工具:贴一段需求,让它生成代码,再人工复制进去。但在真实项目里,这种方式很容易失控。项目越成熟,目录结构、接口封装、页面模式、样式规范、测试方式就越重要。AI 如果不了解这些上下文,就会把自己的假设写进代码里,短期看似很快,长期反而增加返工。

所以我现在更关注的是流程,而不是单次生成效果。

先计划,再实现

面对一个需求,我不会让 AI 一上来直接写代码,而是先让 Codex 进入 Plan 模式。这个阶段会让 AI 阅读项目规则、相关代码、已有模式和边界条件,然后拆出目标、影响文件、潜在风险和验证方式。

计划出来以后,也不会马上进入实现。我会先人工 review 方案,重点看几个问题:

  • 它有没有误解业务目标?
  • 它有没有扩大修改范围?
  • 它是否符合项目已有接口层、组件层和样式约定?
  • 它有没有写清楚验证方式?

如果计划有问题,就继续要求 Codex 更新计划,直到每个关键流程都确认无误,再进入开发。这个步骤看起来比"直接开写"慢一点,但实际能显著减少误改、返工和上下文偏移。

我现在更愿意把 AI 当成研发流程里的一个节点:需求澄清、方案拆解、实现、自检、验证、总结,都可以让它参与,但每一步都要有边界。

让 AI 在真实仓库里工作

Agentic Coding 的收益,在真实仓库里会更明显。因为真实仓库里有大量可复用信息:目录结构、组件封装、请求层、样式变量、业务约束、历史实现方式。这些信息如果能被 AI 读取和遵守,输出质量会比单纯靠 prompt 稳定得多。

我比较看重 AI 编程助手的几个能力:

  • 能围绕本地仓库持续工作,而不是只生成代码片段。
  • 能读文件、查上下文、跑命令、做验证。
  • 能把调研、计划、实现、review 和总结串成一次完整会话。
  • 能通过工具调用接入浏览器、设计稿、文档和任务流程。

它的价值不只是"生成代码",而是把一段原本分散的研发动作组织起来。

我目前主要使用 Codex 做这类工作。原因不只是模型能力,也包括客户端能力、工具调用、本地仓库协作、验证链路和成本可预期性。Claude Code 也有很强的能力,但不同工具在用量限制、账号稳定性、插件生态和团队预算上各有取舍。真正重要的不是押注某个名字,而是选择能稳定接入团队流程的工具。

计划能力比 prompt 技巧更重要

复杂需求里,最容易出问题的不是代码语法,而是方向。需求不清、设计不清、规则不清时,AI 很容易把"自己的假设"直接写成实现。

因此,计划能力比 prompt 技巧更重要。一个好的计划至少应该回答:

  • 这次到底要解决什么问题?
  • 哪些文件或模块会受影响?
  • 哪些地方不能动?
  • 怎么确认改完是对的?
  • 如果 UI 或接口有不确定性,应该先问什么?

当计划足够清晰以后,AI 更像一个高效执行器;如果计划不清晰,它就会变成一个高效制造偏差的工具。

用隔离工作区做并行开发

另一个很有价值的实践是使用隔离工作区。对于可以拆开的任务,可以让不同任务在不同工作区里并行推进。这样做有几个好处:

  • 每个上下文更小,AI 更容易聚焦。
  • 变更之间相互隔离,合并时更清晰。
  • 一个任务失败,不会污染主工作区。
  • 多个方向可以同时验证,节省等待时间。

并行不是为了看起来更快,而是为了让变更边界更清楚。

设计稿要变得 AI 友好

UI 类需求是 Agentic Coding 很容易产生收益的场景。相比纯文字描述,结构化设计上下文能让 AI 更快理解布局、层级、状态和交互关系。

但这里有一个前提:设计稿本身也要对 AI 友好。比如:

  • 使用组件化结构,而不是一堆散乱图层。
  • 图层和组件命名有语义。
  • 使用自动布局、变量和设计 token。
  • 尽量保留文本、颜色、间距、状态等可识别信息。
  • 对复杂交互补充说明。

如果只给 AI 一张截图,它只能猜。如果能给它结构化设计信息,它就能更准确地映射到代码实现。

在工具支持上,我更推荐优先使用 Figma 这类成熟设计工具链,并通过 Figma MCP 让 AI 读取具体页面、模块或组件的上下文,而不是只靠图片识别。Codex 官方插件市场已经支持 Figma,Claude Code 对 Figma 的支持也很完整;相比之下,蓝湖这类工具目前还缺少成熟的官方 AI 编程插件路径,落地成本会明显更高。

把个人经验沉淀成团队资产

很多团队一开始会沉迷于 prompt,但 prompt 往往是一次性的。真正更有价值的是把经验沉淀成团队可复用的规则和技能。

比如在项目里沉淀几类指导:

  • 请求层应该怎么封装。
  • 表单、弹窗、列表联动应该遵守什么模式。
  • 样式应该放在哪里,哪些变量可以复用。
  • 完成任务前必须跑哪些检查。
  • 什么情况下必须先计划,什么情况下可以直接修改。

这些规则一旦固定下来,AI 就不只是听某个人临时指挥,而是能沿着团队已有工程经验工作。团队复用同一套规则,输出也会更稳定。

除了项目自定义规则,我也会借鉴一些开源 skills,比如 brainstorming、writing-plans、verification-before-completion 这类通用工作流。Claude Code 的 skill 也不一定只能在 Claude Code 里用,很多时候可以让 Codex 帮忙改写成更适合 Codex 的版本:替换工具调用、调整路径约定、补上本仓库的验证命令和权限边界。

AI 不只写代码

在实际工作里,AI 的价值不止于写代码。它还可以参与很多上游和下游工作:

  • 帮产品经理做头脑风暴、方案比较和需求收敛。
  • 帮测试同学补充测试点、边界场景和回归清单。
  • 帮研发做资料整理、技术调研和文档草稿。
  • 帮团队把一次性的经验整理成长期可复用的文档。

调研类任务尤其适合结合浏览器能力。Codex 官方联网搜索适合快速查资料和拿引用,但更复杂的产品调研往往需要真实浏览器环境:登录态页面、动态渲染、点击滚动、截图、媒体提取、多页面并行访问等。这里我会搭配 web-access 这类浏览器调研插件,让 AI 更接近真实用户访问网页的方式。

语音输入也是一个容易被低估的效率点。很多时候,我们不是想不清楚,而是懒得打字。我现在会用 Typeless 把口头想法快速整理成更清晰的文字,再交给 AI 继续处理。它不只是语音转文字,更像是把零散表达整理成可执行输入。

边界仍然很重要

当然,这些实践还没有覆盖所有场景。比如测试驱动开发、Web 端自动化测试、桌面客户端自动化测试等流程,还需要继续验证,不能过早包装成成熟经验。

我现在比较确定的收益主要来自这些方向:

  • 计划先行。
  • 仓库上下文读取。
  • 设计稿到 UI 的结构化落地。
  • 团队规则和技能沉淀。
  • 隔离工作区并行开发。
  • 调研和文档辅助。

而需要继续探索的是更完整的自动化验证链路,以及如何在团队层面稳定推广。

结语

Agentic Coding 的核心不是"谁的 prompt 更厉害",也不是"AI 能不能一次写出完美代码"。真正重要的是:我们能不能把 AI 接入已有工程体系,让它理解上下文、遵守规则、执行计划、完成验证,并把个人经验沉淀成团队资产。

从这个角度看,AI 编程不只是效率工具,而是一种新的研发协作方式。

相关推荐
__WanG1 小时前
Claude Code 多模型网关部署教程:从零实现多厂商大模型并行调度
ai·大模型·ai编程
闲人小吴1 小时前
superpowers:agentic skills框架,vibe coding中的软件工程!
ai编程·vibecoding
一碗面4212 小时前
单手掌控Claude Code(一)
ai编程
GoCodingInMyWay2 小时前
Claude 智能体工程
ai编程·claude
还有几根头发呀2 小时前
Cursor 接入 DeepSeek‑V4‑Pro 完整指南(2026 实测)
ai编程·cursor·deepseek‑v4‑pro
何陋轩2 小时前
Spring AI Alibaba实战:通义千问与Java的完美融合
人工智能·后端·ai编程
码上进化论3 小时前
第三篇-设置Claude code 安全边界:给自己的项目装上一套安全带
ai编程
UXbot3 小时前
2026年文字转原型AI工具推荐:输入一句需求描述,自动生成多页面可交互界面
前端·低代码·ui·交互·ai编程·原型模式
.-Smile-.3 小时前
【开源】Yszen AI:一个开箱即用的 Harness 架构 Agent 脚手架(FastAPI + LangGraph + React)
aigc·agent·harness