Agent Skills
为 AI 编程 Agent 打造的生产级工程技能。
Skills 将资深工程师在构建软件时所使用的工作流程、质量关卡和最佳实践编码固化,打包成可被 AI Agent 在开发各个阶段中一致遵循的规范。
DEFINE PLAN BUILD VERIFY REVIEW SHIP ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ │ Idea │ ───▶ │ Spec │ ───▶ │ Code │ ───▶ │ Test │ ───▶ │ QA │ ───▶ │ Go │ │Refine│ │ PRD │ │ Impl │ │Debug │ │ Gate │ │ Live │ └──────┘ └──────┘ └──────┘ └──────┘ └──────┘ └──────┘ /spec /plan /build /test /review /ship
Commands
7 个斜杠命令,对应开发生命周期的各个阶段。每个命令会自动激活对应的 Skills。
| 你正在做的事 | 命令 | 核心原则 |
| 定义要构建什么 | /spec | 先写规格,再写代码 |
| 规划如何构建 | /plan | 小而原子化的任务 |
| 增量构建 | /build | 每次一个切片 |
| 验证它能工作 | /test | 测试即证明 |
| 合并前审查 | /review | 提升代码健康度 |
| 简化代码 | /code-simplify | 清晰优于聪明 |
| 发布到生产 | /ship | 越快越安全 |
想在规格确定后减少手动步骤?/build auto 只需一次审批,即可在单次流程中自动生成计划并实现所有任务------你只需批准一次计划,之后它将自主运行。它消除的是任务之间的人工介入,而非验证环节:每个任务仍遵循测试驱动并单独提交,遇到失败或高风险步骤时会暂停。
Skills 也会根据你当前的操作自动激活------设计 API 时触发 api-and-interface-design,构建 UI 时触发 frontend-ui-engineering,以此类推。
Quick Start
Claude Code(推荐)
Marketplace 安装:
/plugin marketplace add addyosmani/agent-skills /plugin install agent-skills@addy-agent-skills
SSH 报错? Marketplace 通过 SSH 克隆仓库。如果你尚未在 GitHub 上配置 SSH 密钥,可以选择添加 SSH 密钥,或使用完整的 HTTPS URL 强制通过 HTTPS 克隆:
/plugin marketplace add https://github.com/addyosmani/agent-skills.git /plugin install agent-skills@addy-agent-skills
本地 / 开发环境:
git clone https://github.com/addyosmani/agent-skills.git claude --plugin-dir /path/to/agent-skills
Cursor
将任意 SKILL.md 复制到 .cursor/rules/,或直接引用完整的 skills/ 目录。详见 docs/cursor-setup.md。
Antigravity CLI
作为原生插件安装,支持 Skills、子 Agent 和斜杠命令。详见 docs/antigravity-setup.md。
从仓库安装:
agy plugin install https://github.com/addyosmani/agent-skills.git
从本地克隆安装:
git clone https://github.com/addyosmani/agent-skills.git agy plugin install ./agent-skills
Gemini CLI
作为原生 Skills 安装以支持自动发现,或添加到 GEMINI.md 以保持持久上下文。详见 docs/gemini-cli-setup.md。
从仓库安装:
gemini skills install https://github.com/addyosmani/agent-skills.git --path skills
从本地克隆安装:
gemini skills install ./agent-skills/skills/
Windsurf
将 Skill 内容添加到你的 Windsurf 规则配置中。详见 docs/windsurf-setup.md。
OpenCode
通过 AGENTS.md 和 skill 工具实现 Agent 驱动的 Skill 执行。
GitHub Copilot
使用 agents/ 中的 Agent 定义作为 Copilot 角色,并将 Skill 内容放入 .github/copilot-instructions.md。详见 docs/copilot-setup.md。
Kiro IDE & CLI
Kiro 的 Skills 位于 ".kiro/skills/" 目录下,可存储在项目级或全局级。Kiro 同样支持 Agents.md。详见 Kiro 文档:https://kiro.dev/docs/skills/
Codex / 其他 Agent
Skills 是纯 Markdown 格式------任何支持系统提示词或指令文件的 Agent 均可使用。详见 docs/getting-started.md。
全部 24 个 Skills
上述命令只是入口。该套件共包含 24 个 Skills------23 个生命周期 Skills 加上 using-agent-skills 元技能。每个 Skill 都是一套结构化工作流,包含步骤、验证关卡和反合理化表格。你也可以直接引用任意 Skill。
Meta - 发现适用的 Skill
| Skill | 功能描述 | 使用场景 |
| using-agent-skills | 将incoming工作映射到对应的 Skill 工作流,并定义共享操作规则 | 开启一个会话,或决定应用哪个 Skill 时 |
Define - 明确要构建什么
| Skill | 功能描述 | 使用场景 |
| interview-me | 一次一问的访谈,挖掘用户真正想要的而非他们以为自己应该要的,直至约 95% 的置信度 | 需求不够明确,或用户说"interview me"/"grill me"时 |
| idea-refine | 结构化的发散/收敛思维,将模糊想法转化为具体方案 | 有一个粗略概念需要深入探索时 |
| spec-driven-development | 在写任何代码之前,先编写涵盖目标、命令、结构、代码风格、测试和边界的 PRD | 启动新项目、新功能或重大变更时 |
Plan - 拆解任务
| Skill | 功能描述 | 使用场景 |
| planning-and-task-breakdown | 将规格分解为带验收标准和依赖顺序的小型可验证任务 | 已有规格,需要可执行单元时 |
Build - 编写代码
| Skill | 功能描述 | 使用场景 |
| incremental-implementation | 细竖向切片------实现、测试、验证、提交。功能开关、安全默认值、支持回滚的变更 | 任何涉及多个文件的改动 |
| test-driven-development | Red-Green-Refactor、测试金字塔(80/15/5)、测试规模、DAMP 优于 DRY、Beyonce Rule、浏览器测试 | 实现逻辑、修复 Bug 或变更行为时 |
| context-engineering | 在正确的时机向 Agent 提供正确的信息------规则文件、上下文打包、MCP 集成 | 开启会话、切换任务或输出质量下降时 |
| source-driven-development | 将每个框架决策都建立在官方文档之上------核实、引用来源、标记未经验证的内容 | 希望获得任何框架或库的权威、来源可引用的代码时 |
| doubt-driven-development | 对进行中的每个非平凡决策进行对抗性全新上下文审查------CLAIM → EXTRACT → DOUBT → RECONCILE → STOP,并支持用户授权的跨模型升级 | 风险高(生产环境、安全、不可逆操作)、在陌生代码中工作,或现在验证一个自信的输出比事后调试更经济时 |
| frontend-ui-engineering | 组件架构、设计系统、状态管理、响应式设计、WCAG 2.1 AA 无障碍标准 | 构建或修改面向用户的界面时 |
| api-and-interface-design | 契约优先设计、Hyrum's Law、One-Version Rule、错误语义、边界验证 | 设计 API、模块边界或公共接口时 |
Verify - 验证它能工作
| Skill | 功能描述 | 使用场景 |
| browser-testing-with-devtools | Chrome DevTools MCP 获取实时运行时数据------DOM 检查、控制台日志、网络追踪、性能分析 | 构建或调试任何在浏览器中运行的内容时 |
| debugging-and-error-recovery | 五步分类法:复现、定位、缩减、修复、防护。停线规则、安全回退 | 测试失败、构建中断或行为异常时 |
Review - 合并前的质量关卡
| Skill | 功能描述 | 使用场景 |
| code-review-and-quality | 五维度审查、变更规模(约 100 行)、严重性标签(Nit/Optional/FYI)、审查速度规范、拆分策略 | 合并任何变更之前 |
| code-simplification | Chesterton's Fence、500 行规则、在保持完全一致行为的前提下降低复杂度 | 代码可以运行,但比应有的更难阅读或维护时 |
| security-and-hardening | OWASP Top 10 防御、认证模式、密钥管理、依赖审计、三层边界系统 | 处理用户输入、认证、数据存储或外部集成时 |
| performance-optimization | 度量优先方法------Core Web Vitals 目标、分析工作流、包分析、反模式检测 | 存在性能要求或怀疑出现性能回退时 |
Ship - 自信发布
| Skill | 功能描述 | 使用场景 |
| git-workflow-and-versioning | 主干开发、原子提交、变更规模(约 100 行)、提交即存档点模式 | 进行任何代码变更时(始终适用) |
| ci-cd-and-automation | Shift Left、越快越安全、功能开关、质量门禁流水线、失败反馈循环 | 搭建或修改构建与部署流水线时 |
| deprecation-and-migration | 代码即负债思维、强制性与建议性废弃、迁移模式、僵尸代码清理 | 下线旧系统、迁移用户或弃用功能时 |
| documentation-and-adrs | 架构决策记录(ADR)、API 文档、内联文档标准------记录为什么 | 做架构决策、变更 API 或发布功能时 |
| observability-and-instrumentation | 结构化日志、RED 指标、OpenTelemetry 追踪、基于症状的告警------边构建边埋点 | 添加遥测数据,或发布任何在生产中运行的内容时 |
| shipping-and-launch | 上线前检查清单、功能开关生命周期、分阶段发布、回滚流程、监控配置 | 准备部署到生产环境时 |
Agent Personas
预配置的专家角色,用于针对性审查:
| Agent | 角色 | 视角 |
| code-reviewer | 资深 Staff Engineer | 五维度代码审查,以"Staff Engineer 会批准这个吗?"为标准 |
| test-engineer | QA 专家 | 测试策略、覆盖率分析和 Prove-It 模式 |
| security-auditor | 安全工程师 | 漏洞检测、威胁建模、OWASP 评估 |
| web-performance-auditor | Web 性能工程师 | Core Web Vitals 审计,支持 Quick/Deep 两种模式及指标诚实性规则;通过 /webperf 运行 |
Reference Checklists
Skills 按需引用的快速参考资料:
| 参考资料 | 涵盖内容 |
| testing-patterns.md | 测试结构、命名、Mock、React/API/E2E 示例、反模式 |
| security-checklist.md | 提交前检查、认证、输入验证、Headers、CORS、OWASP Top 10 |
| performance-checklist.md | Core Web Vitals 目标、前后端检查清单、测量命令 |
| accessibility-checklist.md | 键盘导航、屏幕阅读器、视觉设计、ARIA、测试工具 |
Skills 工作原理
每个 Skill 都遵循一致的结构:
┌─────────────────────────────────────────────────┐ │ SKILL.md │ │ │ │ ┌─ Frontmatter ─────────────────────────────┐ │ │ │ name: lowercase-hyphen-name │ │ │ │ description: Guides agents through [task].│ │ │ │ Use when... │ │ │ └───────────────────────────────────────────┘ │ │ Overview → What this skill does │ │ When to Use → Triggering conditions │ │ Process → Step-by-step workflow │ │ Rationalizations → Excuses + rebuttals │ │ Red Flags → Signs something's wrong │ │ Verification → Evidence requirements │ └─────────────────────────────────────────────────┘
关键设计理念:
-
流程,而非散文。 Skills 是 Agent 遵循的工作流程,而非供参考阅读的文档。每个 Skill 都包含步骤、检查点和退出标准。
-
反合理化。 每个 Skill 都包含一张常见借口表,列举 Agent 用来跳过步骤的理由(例如"我稍后再加测试")及其对应的反驳论据。
-
验证不可协商。 每个 Skill 都以证据要求作为结尾------测试通过、构建输出、运行时数据。"感觉没问题"永远不够。
-
渐进式披露。
SKILL.md是入口点。相关参考资料仅在需要时才会加载,从而将 token 用量降至最低。
Project Structure
agent-skills/ ├── skills/ # 24 skills (23 lifecycle + 1 meta) │ ├── interview-me/ # Define │ ├── idea-refine/ # Define │ ├── spec-driven-development/ # Define │ ├── planning-and-task-breakdown/ # Plan │ ├── incremental-implementation/ # Build │ ├── context-engineering/ # Build │ ├── source-driven-development/ # Build │ ├── doubt-driven-development/ # Build │ ├── frontend-ui-engineering/ # Build │ ├── test-driven-development/ # Build │ ├── api-and-interface-design/ # Build │ ├── browser-testing-with-devtools/ # Verify │ ├── debugging-and-error-recovery/ # Verify │ ├── code-review-and-quality/ # Review │ ├── code-simplification/ # Review │ ├── security-and-hardening/ # Review │ ├── performance-optimization/ # Review │ ├── git-workflow-and-versioning/ # Ship │ ├── ci-cd-and-automation/ # Ship │ ├── deprecation-and-migration/ # Ship │ ├── documentation-and-adrs/ # Ship │ ├── observability-and-instrumentation/ # Ship │ ├── shipping-and-launch/ # Ship │ └── using-agent-skills/ # Meta: how to use this pack ├── agents/ # 4 specialist personas ├── references/ # 4 supplementary checklists ├── hooks/ # Session lifecycle hooks ├── .claude/commands/ # 7 slash commands (Claude Code) ├── .gemini/commands/ # 7 slash commands (Gemini CLI) ├── commands/ # 8 slash commands (Antigravity CLI) ├── plugin.json # Antigravity plugin manifest └── docs/ # Setup guides per tool
Why Agent Skills?
AI 编程 Agent 默认走最短路径------这往往意味着跳过规格说明、测试、安全审查,以及那些让软件变得可靠的工程实践。Agent Skills 为 Agent 提供了结构化的工作流,强制执行与资深工程师在生产代码中所体现的同等规范。
每项 skill 都凝聚了来之不易的工程判断力:何时 撰写规格说明、测什么 、如何 审查,以及何时上线。这些不是泛泛而谈的提示词------而是那种有主见、以流程驱动的工作流,正是它们将生产级别的工作与原型级别的工作区分开来。
Skills 融入了 Google 工程文化中的最佳实践------包括 Software Engineering at Google 以及 Google 工程实践指南 中的理念。你将在 API 设计中看到 Hyrum 定律,在测试中看到 Beyoncé 规则与测试金字塔,在代码审查中看到变更粒度与审查速度规范,在简化设计中看到 Chesterton 之栅栏,在 Git 工作流中看到基于主干的开发(trunk-based development),在 CI/CD 中看到左移(Shift Left)与功能开关,以及一项专门的废弃(deprecation)skill------将代码视为一种负债。这些并非抽象原则------它们被直接嵌入到 Agent 所遵循的分步工作流之中。
Contributing
Skills 应当做到:具体 (可执行的步骤,而非模糊的建议)、可验证 (具有明确的完成标准与证据要求)、经过实战检验 (基于真实工作流)、以及精简(只包含引导 Agent 所必需的内容)。
格式规范请参阅 docs/skill-anatomy.md,贡献指南请参阅 CONTRIBUTING.md。
License
MIT --- 欢迎在你的项目、团队和工具中使用这些 skills。