【github 爆款】Agent Skill项目全景汇报 + 联动deepseek-TUI
一、项目核心定位
Agent Skills 是一套为 AI 编程智能体设计的"工程纪律操作系统"。它的核心洞察是:AI 编码智能体天然倾向于走捷径------跳过规格说明、测试、安全审查等步骤,而这些正是可靠软件和原型软件之间的分水岭。
项目将资深工程师的隐性工作流显性化为一套结构化技能,强制 AI 智能体在每个开发阶段都遵循生产级纪律。
二、架构全景图
2.1 六阶段开发生命周期
DEFINE → PLAN → BUILD → VERIFY → REVIEW → SHIP
/spec /plan /build /test /review /ship
2.2 三层体系
| 层级 | 组件 | 职责 |
|---|---|---|
| Commands(入口) | 7 个斜杠命令 | 用户交互入口,自动激活对应技能 |
| Skills(核心) | 22 个技能文件 | 结构化工作流,含步骤、验证门、反合理化护栏 |
| Personas(专项) | 3 个智能体角色 | 代码审查员、测试工程师、安全审计员,并行执行 |
2.3 22 个技能分布
| 阶段 | 技能数 | 代表技能 |
|---|---|---|
| Define | 2 | 想法精炼、规格驱动开发 |
| Plan | 1 | 任务拆解与规划 |
| Build | 8 | 增量实施、TDD、前端工程、API设计、上下文工程、源码驱动开发、质疑驱动开发 |
| Verify | 2 | 浏览器调试、故障排查 |
| Review | 4 | 代码审查、代码简化、安全加固、性能优化 |
| Ship | 5 | Git工作流、CI/CD、废弃与迁移、文档与ADR、发布上线 |
| Meta | 1 | 技能调度 |
三、核心设计原则
3.1 流程优先,而非散文
技能不是参考文档,而是工作流,包含步骤、检查点和退出标准。
3.2 反合理化机制
每个技能都有一个"常见借口表",预判 AI 会如何试图跳过步骤,并提供反驳论据。例如:
❌ "这个改动太小了,不需要测试"
✅ "改动的风险不在于大小,而在于影响面"
3.3 验证不可协商
每个技能结束时必须有证据------测试通过、构建输出、运行时数据。"看起来正确"永远不够。
3.4 渐进式信息披露
SKILL.md 是入口,辅助参考材料仅在需要时加载,最小化 token 消耗。
四、技能解剖结构(每个 SKILL.md 的标准格式)
┌─────────────────────────────┐
│ YAML frontmatter │ ← name + description
│ Overview │ ← 技能做什么
│ When to Use │ ← 触发条件
│ Process (步骤流程) │ ← 核心工作流
│ Rationalizations (反合理化) │ ← 借口与反驳表
│ Red Flags (危险信号) │ ← 应用出错的信号
│ Verification (验证要求) │ ← 证据需求
└─────────────────────────────┘
五、支持的工具生态
| 工具 | 集成方式 |
|---|---|
| Claude Code(推荐) | 插件市场安装,7 个斜杠命令 |
| Cursor | 复制 SKILL.md 到 .cursor/rules/ |
| Gemini CLI | gemini skills install 原生安装 |
| Windsurf | 添加到 Windsurf 规则配置 |
| GitHub Copilot | 使用 agents/ 作为智能体定义 |
| OpenCode | 通过 AGENTS.md + skill 工具驱动 |
| Kiro IDE | 放入 .kiro/skills/ |
| 其他智能体 | 纯 Markdown,可用于任何接受系统提示的工具 |
六、与其他项目/工具的潜在结合点分析
基于这套体系,我看出以下几个可能切中您痛点的场景:
🔴 痛点 1:AI 生成代码缺乏规格约束,跑偏率高⭐️⭐️⭐️
➡️ 对应技能 :spec-driven-development ------强制先写 PRD(目标、命令、结构、代码风格、测试、边界),再写代码。杜绝"猜着写"。
🔴 痛点 2:大块功能一次生成,难以验证和回滚 ⭐️⭐️⭐️
➡️ 对应技能 :incremental-implementation ------薄纵切面增量实施,特性开关、安全默认值、提交即保存点。每步可验证。
🔴 痛点 3:AI 倾向于跳过测试或写无效测试⭐️
➡️ 对应技能 :test-driven-development ------红-绿-重构循环,测试金字塔(80/15/5),Beyonce 规则。
🔴 痛点 4:安全漏洞在代码生成阶段被忽略⭐️⭐️
➡️ 对应技能 :security-and-hardening ------OWASP Top 10 防御,认证模式,密钥管理,三级边界系统。
🔴 痛点 5:代码审查看似做了但深度不够⭐️⭐️⭐️
➡️ 对应智能体 :code-reviewer ------五轴审查(正确性、安全性、性能、可维护性、一致性),"资深工程师会批准这个吗?"标准。
🔴 痛点 6:上线前的检查清单总有遗漏⭐️
➡️ 对应技能 :shipping-and-launch ------上线前清单,特性开关生命周期,分阶段发布,回滚程序,监控设置。
七、落地方案建议
根据您当前项目的实际情况,我建议三种采用深度供您选择:
方案 A:轻量接入(1-2 小时)
- 挑选 1-2 个最痛场景的技能
- 将对应的
SKILL.md内容整合到您现有 AI 工具的系统提示或规则文件中 - 例如:只接入
spec-driven-development+code-review-and-quality
方案 B:中度集成(半天)
- 将整个
skills/目录部署到您团队的 AI 编码工具中 - 配置 7 个斜杠命令(如果工具支持)
- 先在一个试点模块运行全流程,观察效果
方案 C:深度定制(1-2 天)
- 基于项目骨架,编写您项目的专属技能
- 将团队已有的编码规范、检查清单、最佳实践按
SKILL.md格式封装 - 建立"团队技能库",让 AI 在每次对话中自动加载
八、总结
这个项目的本质是:将 Google 工程文化中的隐性纪律(Hyrum's Law、Beyonce Rule、Chesterton's Fence 等)显性化为 AI 可执行的工作流。
这是一个很有价值的整合方向。你提到的三个痛点------Agent过度越权、慵懒怠工、过度消耗token ------恰好分别对应Agent Skills的"审批门控""强制分步执行""渐进式信息披露"设计。而DeepSeek TUI本身又内置了Skills目录支持,两套体系的整合几乎可以"开箱即用"。
下面我梳理一下具体的整合方案。
九、拓展整合:DeepSeek TUI原生兼容Skills
根据DeepSeek TUI的文档资料,它已经内置了对SKILL.md的加载机制:
- 技能发现器 会自动扫描多个标准路径:
.agents/skills、skills、.opencode/skills、.claude/skills、以及~/.deepseek/skills load_skill工具可供模型调用,让Agent在需要时主动加载对应技能- 支持通过
/skill <name>命令手动指定激活某个技能
这意味着你不需要做任何"适配层开发"------直接把Agent Skills项目中的skills/目录内容放到DeepSeek TUI能识别的路径下,模型就能在运行时加载这些工作流规则。
9.1、针对三大痛点的映射与加固
9.1.1. 越权问题:Skills的"验证门控" + DeepSeek的"审批门控"
Agent Skills每个技能末尾都有不可协商的验证要求(tests passing, build output, runtime data),这本身就是一道"输出门控"。而DeepSeek TUI有三种审批模式:
| 模式 | 行为 | 适用整合场景 |
|---|---|---|
| Plan | 只读,不修改任何文件 | 对应Define和Plan阶段 |
| Agent | 文件写入自动批准,Shell需手动确认 | 对应Build和Verify阶段 |
| YOLO | 全部自动批准(危险) | 仅用于可信仓库的批量重构 |
建议配置:
- 日常开发使用Agent模式,让Skills的步骤流程约束Agent行为,Shell执行仍需人工确认
- 涉及数据库/线上配置的任务,**加用
/set approval_mode auto|suggest|never**动态收紧审批 - 永远不在陌生项目中使用YOLO模式
9.1.2. 慵懒怠工:反合理化机制天然对症
AI Agent常见的"跳过测试""先写代码后补规格"等偷懒行为,恰好被Skills的Anti-Rationalization Table设计精准打击。例如:
- 当Agent想"这个改动太小,不需要测试"时 →
test-driven-development技能的表格会给出反驳:"改动的风险不在于大小,而在于影响面" - 当Agent想"我直接实现就行"时 →
spec-driven-development技能强制先输出PRD
关键行动 :把Skills文件放在项目根目录的.agents/skills/或skills/下,让DeepSeek TUI在每次对话启动时自动发现并加载。这样Agent的"系统提示"中就天然带上了这些护栏规则。
9.1.3. Token过度消耗:渐进式披露 + 技能加载机制
过度消耗token通常是因为上下文被大量无关信息侵占。Agent Skills的**"渐进式信息披露"**设计正是解药:
SKILL.md只是入口,包含核心步骤和验证门- 辅助参考材料(checklist等)只在需要时才加载
而DeepSeek TUI本身也做了对话记忆压缩 和前缀缓存感知的成本报告,配合Skills的按需加载机制,可以显著减少无效token消耗。
具体操作:
- 不要一次性把所有22个技能都塞进上下文
- 利用
/skill <name>命令手动激活当前阶段需要的技能 - 或者让Agent通过
load_skill工具自动判断并加载
9.2、推荐部署路径
第一步:全局部署(🕐 5分钟)
把Agent Skills的技能目录复制到DeepSeek TUI的用户技能路径:
bash
# 进入agent-skills项目
cd agent-skills
# 复制所有技能到用户级目录(全局可用)
cp -r skills/* ~/.deepseek/skills/
这样你在任何项目中启动DeepSeek TUI时,模型都能发现并加载这些技能。
第二步:项目级加固(🗒 按需)
在具体项目中,如果你想让某个技能始终生效(比如安全审查),可以把对应的SKILL.md放到项目根目录的高优先级路径:
bash
# 在项目根目录
mkdir -p .agents/skills
# 例如:始终启用安全加固技能
cp ~/.deepseek/skills/security-and-hardening/SKILL.md .agents/skills/
DeepSeek TUI的发现器会扫描.agents/skills路径,项目级的技能定义优先级更高。
第三步:模式匹配(📆 日常使用)
| 你在做什么 | 启动命令 | 激活技能 |
|---|---|---|
| 新功能开发 | deepseek --model auto |
/skill spec-driven-development |
| 修Bug | deepseek "debug this error" |
/skill debugging-and-error-recovery |
| 代码审查 | deepseek run pr <N> |
/skill code-review-and-quality |
| 重构 | deepseek --plan |
/skill code-simplification |
| 上线前检查 | deepseek "pre-launch checklist" |
/skill shipping-and-launch |
9.3、⚠️ 注意事项
Agent Skills项目提到它主要面向Claude Code社区 设计,但它的技能文件是纯Markdown格式 ,不依赖任何特定平台的API。而DeepSeek TUI的load_skill工具是通用工具调用机制,模型会读取SKILL.md的内容并按照其中的步骤执行。
🤔 可能存在的小问题:
- Agent Skills的描述中有些术语(如"Claude Code"命令)可能在DeepSeek环境下需要微调
- 建议先做一个小规模测试:只在
~/.deepseek/skills/放一个技能(比如debugging-and-error-recovery),然后让DeepSeek TUI处理一个真实的调试任务,观察它是否会自动加载这个技能