【github 爆款】Agent Skill项目全景汇报 + 联动deepseek-TUI

【github 爆款】Agent Skill项目全景汇报 + 联动deepseek-TUI


一、项目核心定位

Agent Skills 是一套为 AI 编程智能体设计的"工程纪律操作系统"。它的核心洞察是:AI 编码智能体天然倾向于走捷径------跳过规格说明、测试、安全审查等步骤,而这些正是可靠软件和原型软件之间的分水岭。

项目将资深工程师的隐性工作流显性化为一套结构化技能,强制 AI 智能体在每个开发阶段都遵循生产级纪律。


二、架构全景图

2.1 六阶段开发生命周期

复制代码
DEFINE → PLAN → BUILD → VERIFY → REVIEW → SHIP
 /spec    /plan   /build   /test    /review   /ship

2.2 三层体系

层级 组件 职责
Commands(入口) 7 个斜杠命令 用户交互入口,自动激活对应技能
Skills(核心) 22 个技能文件 结构化工作流,含步骤、验证门、反合理化护栏
Personas(专项) 3 个智能体角色 代码审查员、测试工程师、安全审计员,并行执行

2.3 22 个技能分布

阶段 技能数 代表技能
Define 2 想法精炼、规格驱动开发
Plan 1 任务拆解与规划
Build 8 增量实施、TDD、前端工程、API设计、上下文工程、源码驱动开发、质疑驱动开发
Verify 2 浏览器调试、故障排查
Review 4 代码审查、代码简化、安全加固、性能优化
Ship 5 Git工作流、CI/CD、废弃与迁移、文档与ADR、发布上线
Meta 1 技能调度

三、核心设计原则

3.1 流程优先,而非散文

技能不是参考文档,而是工作流,包含步骤、检查点和退出标准。

3.2 反合理化机制

每个技能都有一个"常见借口表",预判 AI 会如何试图跳过步骤,并提供反驳论据。例如:

❌ "这个改动太小了,不需要测试"

✅ "改动的风险不在于大小,而在于影响面"

3.3 验证不可协商

每个技能结束时必须有证据------测试通过、构建输出、运行时数据。"看起来正确"永远不够。

3.4 渐进式信息披露

SKILL.md 是入口,辅助参考材料仅在需要时加载,最小化 token 消耗。


四、技能解剖结构(每个 SKILL.md 的标准格式)

复制代码
┌─────────────────────────────┐
│  YAML frontmatter           │  ← name + description
│  Overview                   │  ← 技能做什么
│  When to Use                │  ← 触发条件
│  Process (步骤流程)          │  ← 核心工作流
│  Rationalizations (反合理化)  │  ← 借口与反驳表
│  Red Flags (危险信号)        │  ← 应用出错的信号
│  Verification (验证要求)     │  ← 证据需求
└─────────────────────────────┘

五、支持的工具生态

工具 集成方式
Claude Code(推荐) 插件市场安装,7 个斜杠命令
Cursor 复制 SKILL.md.cursor/rules/
Gemini CLI gemini skills install 原生安装
Windsurf 添加到 Windsurf 规则配置
GitHub Copilot 使用 agents/ 作为智能体定义
OpenCode 通过 AGENTS.md + skill 工具驱动
Kiro IDE 放入 .kiro/skills/
其他智能体 纯 Markdown,可用于任何接受系统提示的工具

六、与其他项目/工具的潜在结合点分析

基于这套体系,我看出以下几个可能切中您痛点的场景:

🔴 痛点 1:AI 生成代码缺乏规格约束,跑偏率高⭐️⭐️⭐️

➡️ 对应技能spec-driven-development ------强制先写 PRD(目标、命令、结构、代码风格、测试、边界),再写代码。杜绝"猜着写"。

🔴 痛点 2:大块功能一次生成,难以验证和回滚 ⭐️⭐️⭐️

➡️ 对应技能incremental-implementation ------薄纵切面增量实施,特性开关、安全默认值、提交即保存点。每步可验证。

🔴 痛点 3:AI 倾向于跳过测试或写无效测试⭐️

➡️ 对应技能test-driven-development ------红-绿-重构循环,测试金字塔(80/15/5),Beyonce 规则。

🔴 痛点 4:安全漏洞在代码生成阶段被忽略⭐️⭐️

➡️ 对应技能security-and-hardening ------OWASP Top 10 防御,认证模式,密钥管理,三级边界系统。

🔴 痛点 5:代码审查看似做了但深度不够⭐️⭐️⭐️

➡️ 对应智能体code-reviewer ------五轴审查(正确性、安全性、性能、可维护性、一致性),"资深工程师会批准这个吗?"标准。

🔴 痛点 6:上线前的检查清单总有遗漏⭐️

➡️ 对应技能shipping-and-launch ------上线前清单,特性开关生命周期,分阶段发布,回滚程序,监控设置。


七、落地方案建议

根据您当前项目的实际情况,我建议三种采用深度供您选择

方案 A:轻量接入(1-2 小时)

  • 挑选 1-2 个最痛场景的技能
  • 将对应的 SKILL.md 内容整合到您现有 AI 工具的系统提示或规则文件中
  • 例如:只接入 spec-driven-development + code-review-and-quality

方案 B:中度集成(半天)

  • 将整个 skills/ 目录部署到您团队的 AI 编码工具中
  • 配置 7 个斜杠命令(如果工具支持)
  • 先在一个试点模块运行全流程,观察效果

方案 C:深度定制(1-2 天)

  • 基于项目骨架,编写您项目的专属技能
  • 将团队已有的编码规范、检查清单、最佳实践按 SKILL.md 格式封装
  • 建立"团队技能库",让 AI 在每次对话中自动加载

八、总结

这个项目的本质是:将 Google 工程文化中的隐性纪律(Hyrum's Law、Beyonce Rule、Chesterton's Fence 等)显性化为 AI 可执行的工作流

这是一个很有价值的整合方向。你提到的三个痛点------Agent过度越权、慵懒怠工、过度消耗token ------恰好分别对应Agent Skills的"审批门控""强制分步执行""渐进式信息披露"设计。而DeepSeek TUI本身又内置了Skills目录支持,两套体系的整合几乎可以"开箱即用"。

下面我梳理一下具体的整合方案。


九、拓展整合:DeepSeek TUI原生兼容Skills

根据DeepSeek TUI的文档资料,它已经内置了对SKILL.md的加载机制:

  • 技能发现器 会自动扫描多个标准路径:.agents/skillsskills.opencode/skills.claude/skills、以及 ~/.deepseek/skills
  • load_skill工具可供模型调用,让Agent在需要时主动加载对应技能
  • 支持通过/skill <name>命令手动指定激活某个技能

这意味着你不需要做任何"适配层开发"------直接把Agent Skills项目中的skills/目录内容放到DeepSeek TUI能识别的路径下,模型就能在运行时加载这些工作流规则。


9.1、针对三大痛点的映射与加固

9.1.1. 越权问题:Skills的"验证门控" + DeepSeek的"审批门控"

Agent Skills每个技能末尾都有不可协商的验证要求(tests passing, build output, runtime data),这本身就是一道"输出门控"。而DeepSeek TUI有三种审批模式:

模式 行为 适用整合场景
Plan 只读,不修改任何文件 对应Define和Plan阶段
Agent 文件写入自动批准,Shell需手动确认 对应Build和Verify阶段
YOLO 全部自动批准(危险) 仅用于可信仓库的批量重构

建议配置

  • 日常开发使用Agent模式,让Skills的步骤流程约束Agent行为,Shell执行仍需人工确认
  • 涉及数据库/线上配置的任务,**加用/set approval_mode auto|suggest|never**动态收紧审批
  • 永远不在陌生项目中使用YOLO模式
9.1.2. 慵懒怠工:反合理化机制天然对症

AI Agent常见的"跳过测试""先写代码后补规格"等偷懒行为,恰好被Skills的Anti-Rationalization Table设计精准打击。例如:

  • 当Agent想"这个改动太小,不需要测试"时 → test-driven-development技能的表格会给出反驳:"改动的风险不在于大小,而在于影响面"
  • 当Agent想"我直接实现就行"时 → spec-driven-development技能强制先输出PRD

关键行动 :把Skills文件放在项目根目录的.agents/skills/skills/下,让DeepSeek TUI在每次对话启动时自动发现并加载。这样Agent的"系统提示"中就天然带上了这些护栏规则。

9.1.3. Token过度消耗:渐进式披露 + 技能加载机制

过度消耗token通常是因为上下文被大量无关信息侵占。Agent Skills的**"渐进式信息披露"**设计正是解药:

  • SKILL.md只是入口,包含核心步骤和验证门
  • 辅助参考材料(checklist等)只在需要时才加载

而DeepSeek TUI本身也做了对话记忆压缩前缀缓存感知的成本报告,配合Skills的按需加载机制,可以显著减少无效token消耗。

具体操作

  • 不要一次性把所有22个技能都塞进上下文
  • 利用/skill <name>命令手动激活当前阶段需要的技能
  • 或者让Agent通过load_skill工具自动判断并加载

9.2、推荐部署路径

第一步:全局部署(🕐 5分钟)

把Agent Skills的技能目录复制到DeepSeek TUI的用户技能路径:

bash 复制代码
# 进入agent-skills项目
cd agent-skills

# 复制所有技能到用户级目录(全局可用)
cp -r skills/* ~/.deepseek/skills/

这样你在任何项目中启动DeepSeek TUI时,模型都能发现并加载这些技能。

第二步:项目级加固(🗒 按需)

在具体项目中,如果你想让某个技能始终生效(比如安全审查),可以把对应的SKILL.md放到项目根目录的高优先级路径:

bash 复制代码
# 在项目根目录
mkdir -p .agents/skills

# 例如:始终启用安全加固技能
cp ~/.deepseek/skills/security-and-hardening/SKILL.md .agents/skills/

DeepSeek TUI的发现器会扫描.agents/skills路径,项目级的技能定义优先级更高。

第三步:模式匹配(📆 日常使用)
你在做什么 启动命令 激活技能
新功能开发 deepseek --model auto /skill spec-driven-development
修Bug deepseek "debug this error" /skill debugging-and-error-recovery
代码审查 deepseek run pr <N> /skill code-review-and-quality
重构 deepseek --plan /skill code-simplification
上线前检查 deepseek "pre-launch checklist" /skill shipping-and-launch

9.3、⚠️ 注意事项

Agent Skills项目提到它主要面向Claude Code社区 设计,但它的技能文件是纯Markdown格式 ,不依赖任何特定平台的API。而DeepSeek TUI的load_skill工具是通用工具调用机制,模型会读取SKILL.md的内容并按照其中的步骤执行。

🤔 可能存在的小问题

  • Agent Skills的描述中有些术语(如"Claude Code"命令)可能在DeepSeek环境下需要微调
  • 建议先做一个小规模测试:只在~/.deepseek/skills/放一个技能(比如debugging-and-error-recovery),然后让DeepSeek TUI处理一个真实的调试任务,观察它是否会自动加载这个技能

相关推荐
学术小白人1 小时前
往届EI检索稳定!第二届可信大数据与人工智能学术会议(ICTBAI 2026)
大数据·人工智能·物联网·microsoft·数字能源
阳明山水1 小时前
MAPE仅2%为何业务仍不满意?
人工智能·深度学习·机器学习·微信·微信开放平台
wuxinyan1231 小时前
工业级大模型学习之路011:RAG 零基础入门教程(第七篇):查询优化技术
人工智能·学习·rag
caijing3651 小时前
全方位解析建筑设备系统解决方案:提升建筑效率与安全的关键
大数据·人工智能·安全
code bean1 小时前
【LangChain】 输出解析器(Output Parsers)完全指南
大数据·人工智能·langchain
薛定猫AI1 小时前
Codex 与 Claude Code 安装配置完整教程(Windows/Mac/Linux)
人工智能
TDengine (老段)1 小时前
TDengine 集群拓扑深度解析 — 节点发现、EP 机制与负载均衡
大数据·数据库·人工智能·重构·负载均衡·时序数据库·tdengine
Kiyra1 小时前
异步任务不用 Kafka 也行:用 Redis Stream 搭一套轻量级 Producer/Consumer 框架
数据库·人工智能·redis·分布式·后端·缓存·kafka
城事漫游Molly1 小时前
定量研究设计清单:问卷、实验与变量操作化怎么做?
大数据·人工智能·算法·ai写作·论文笔记