我把 Codex 协作经验,整理成了一套公共 Skills

最近我越来越明显地感觉到:AI 编程真正拉开差距的,不只是模型强不强,而是你有没有一套稳定的协作系统。

同一个 Codex,有的人用起来像高级搜索框,有的人用起来像靠谱的工程同事。差别往往不在某一句神奇 prompt,而在于:项目规则、任务交接、验证标准、风险门禁、错误复盘,这些东西有没有被沉淀下来。

一句话概括:Skill 是把反复提醒 AI 的工作习惯,做成可复用的能力。

Skill 不是提示词,是工作制度

我理解的 Skill,不是"写一段更长的 prompt",而是 Codex 的专业工作说明书。

平时我们和 AI 协作,经常会反复强调这些事:

  • 新项目先读规则,不要上来就改。

  • 不要把聊天历史当长期记忆,重要信息写进项目文件。

  • 长任务要能交接,不能一断会话就从头来。

  • 改完不算完成,要跑验证,要说明没测什么。

  • 权限、日期、通知、迁移、部署这些高风险地方,要额外检查。

  • 遇到回归和事故,要记录根因和漏检点,下次别再踩。

这些规则如果每次都靠人提醒,很快就会变成负担。所以我把它们整理成了一套公共 Skills,让 Codex 在对应场景里自动按这套流程工作。

我这套公共 Skills 想解决什么?

我遇到的问题不是"AI 不会写代码"。更多时候,问题出在协作过程本身:

  • 上下文越来越长,聊天变慢,恢复也慢。

  • 前面讨论过的项目事实,换个会话又要重新解释。

  • 任务做到一半,状态散在聊天里,没有稳定交接文件。

  • AI 改完代码就想收工,但实际上还没验证。

  • 高风险逻辑容易漏边界,比如权限、时区、通知、数据迁移。

  • 同一个坑踩过一次,没有沉淀成下一次的检查项。

所以这套 Skills 的目标不是让 Codex "话更多",而是让它工作更像工程同事:知道先读什么、状态写到哪里、改完怎么验证、出错后怎么复盘。

这套公共 Skills 的六类协作能力

第一类:项目治理,先把协作入口建起来

project-governance 是整套体系的入口。它负责在项目里创建一组协作文件,让新会话不用依赖完整聊天历史。

  • AGENTS.md

    :项目级入口,告诉 Codex 新会话先读什么。

  • PROJECT_CONTEXT.md

    :稳定项目事实,比如技术栈、目录结构、运行命令。

  • SECRETS.local.md

    :本地敏感信息,默认加入忽略,不进入公共规则。

新项目里,我可以直接说:

复制代码
Init_project

它会检查并创建缺失的治理文件。这个动作的意义是:先搭项目制度,再开始让 AI 干活。

第二类:任务交接,解决长会话和断点续做

长任务最怕状态散在聊天里。聊久了,上下文会变重;换新会话,又容易丢细节。

所以我加了两类交接文件:

  • ACTIVE_TASK.md

    :当前任务草稿,记录目标、验收、相关文件、已运行命令、发现、阻塞和下一步。

  • SESSION_SUMMARY.md

    :替换式会话摘要,保留当前状态、近期变更、决策、未决事项和下次检查项。

当任务变长,或者准备开新会话时,我可以说:

复制代码
Handoff

Codex 会优先用内置脚本更新交接文件。这样下一次不是靠"模型记得",而是靠项目文件恢复。

第三类:发布验证,写完不等于完成

release-validation 的核心原则很简单:Implementation is not completion

代码写完只是其中一步。真正说"完成"之前,需要有验收标准和验证证据:

  • 这个任务的触发条件是什么?

  • 用户可见结果是什么?

  • 跑了哪些测试或检查?

  • 哪些通过了?

  • 哪些没测,为什么没测?

  • 还有什么残余风险?

这会逼着 Codex 不只是"把文件改了",而是把任务走到可交付状态。

第四类:风险门禁,高风险改动要额外检查

quality-gates 负责挑出高风险场景的检查项。它不是让最终回答变长,而是让 Codex 在关键地方别漏。

比如这些场景就需要门禁:

  • 权限和可见性:前端可以提醒,但服务端必须最终约束。

  • 表单和隐藏状态:页面看到的值,要和提交 payload 一致。

  • 日期和截止时间:时区、before / at / after、跨天、月末都要说清楚。

  • 通知:触发事件、收件人、去重、聚合、失败日志都要定义。

  • 定时任务和异步任务:首次运行、重复运行、重试、last-run 标记都要检查。

  • 迁移和部署:已有数据、可重复执行、回滚路径和健康检查都不能漏。

这类 Skill 的价值在于,它把"老工程师脑子里的风险清单"显性化了。

第五类:后端工程,别只改一层

backend-engineering 负责让 Codex 用后端工程的方式看问题。

后端改动最怕只盯着一个函数。一个字段、一个状态、一个接口,背后可能牵涉:

  • 数据库 schema 和 migration;

  • 请求参数和响应契约;

  • 服务端校验和权限;

  • 前端或其他 API 消费者;

  • 日志、通知、外部集成;

  • 重试、幂等、并发和旧数据。

这个 Skill 的作用,是让 Codex 把数据模型、API 边界、持久化、副作用和部署行为放在一起验证。

第六类:问题复盘,把错误变成下次的检查项

这块是我觉得最值得强调的。

很多 AI 协作的问题,不是当下修不好,而是同一个坑下次还会再踩 。所以我在项目治理里加入了 CODING_NOTES.md

它不是普通笔记,而是事故和回归经验库。结构是:

  • Symptom / 现象

    :发生了什么。

  • Root Cause / 根因

    :为什么发生。

  • Missed Check / 漏检

    :什么检查本可以发现。

  • Prevention / 预防

    :下次要搜索、测试或验证什么。

release-validation 里也有 Failure Protocol:如果用户反馈回归,先承认这是验证遗漏,然后查日志和数据,不要猜;修复后把可复用经验写回项目 notes;最后重新跑相关验收场景。

这让 Codex 不只是"完成这一次任务",还会把真实错误变成未来任务的检查项。

这套 Skills 的好处

对我来说,它最大的价值不是少写几句提示词,而是把协作变稳定了。

  • 新项目启动更快

    :一句 Init_project 建好协作入口。

  • 长任务更容易续上

    :当前状态写进 ACTIVE_TASK.mdSESSION_SUMMARY.md

  • 完成标准更清楚

    :不再把"改完文件"当作"完成任务"。

  • 高风险改动更稳

    :权限、日期、通知、迁移、部署都有对应检查。

  • 后端改动更完整

    :API、schema、DB、权限、副作用一起看。

  • 错误能沉淀

    :事故、回归、漏检点进入 CODING_NOTES.md,下次先读。

适合谁用?

如果你只是偶尔问 AI 一个代码问题,这套东西可能有点重。

但如果你经常让 Codex 做这些事,它会很有价值:

  • 长期维护一个项目;

  • 频繁跨会话继续工作;

  • 让 AI 直接改代码、跑命令、做验证;

  • 涉及后端、数据库、部署、通知、权限;

  • 希望把踩过的坑沉淀成下次自动检查的规则。

最后

我现在越来越觉得,AI 编程不是单纯"模型替人写代码",而是人、模型、项目规则、验证流程一起组成的软件生产系统。

这套公共 Skills 做的事,就是把我反复提醒 Codex 的协作习惯,整理成一个可复用的系统:能启动项目、能交接任务、能验证发布、能识别风险、能做后端工程判断,也能把错误沉淀下来。

**一句话总结:**不要只让 AI 记住这次聊天,要让它在下个项目、下个会话、下个错误之后,仍然按更好的方法工作。

关注我并留言,获取Public-Skills

相关推荐
Swift社区1 小时前
具身智能:让AI真正“理解”物理世界
人工智能
落叶无情1 小时前
ICEF 框架+框架动态补全机制:从零构建虚构地缘冲突分析模型
人工智能
爱分享的康康1 小时前
低成本自动驾驶数据采集设备理性分析:康谋入门套装适配性解析
大数据·人工智能
深小乐1 小时前
个人知识库,折腾一圈后我还是选了 Obsidian
人工智能
_Aaron___2 小时前
Spring AI 接入 MCP:工具调用不是“能调就行”,关键是边界治理
java·人工智能·spring
YueJoy.AI2 小时前
创业团队如何进行绩效管理
人工智能·ai·语言模型
春日见2 小时前
RL精华知识
人工智能·机器学习
东方佑2 小时前
波动力学语言模型(Wave Dynamics Language Model, WDLM)
人工智能·语言模型·自然语言处理
John_ToDebug2 小时前
CLAUDE.md 与 Skills 的区别:一张表彻底分清
人工智能·经验分享·ai