【卷卷观察】Agent Skills 为什么突然火了?我花了一晚上研究,结论有点反直觉

结论先甩:Agent Skills 不是什么新东西,但它解决了一个很实在的问题------怎么让 AI 不要找借口,真正把活干完。


我在用 AI 写代码的时候,最烦的不是 AI 写得慢,是 AI 写完之后跟你说"测试我稍后加上"。

然后就没有然后了。

这个问题我遇到太多次了。AI 写的代码逻辑看起来没问题,但测试覆盖率 0%、边界情况没考虑、错误处理是空的。你让 AI 补,AI 说"好的我补",然后生成一堆看起来像测试的代码,实际上根本没跑通。

直到我看到 Addy Osmani 写的 Agent Skills 文章,我才意识到:问题不在 AI 本身,在于我们给 AI 的技能描述太水了。


什么是 Agent Skills

简单说,Agent Skills 就是给 AI Agent 用的"标准作业指导书"。

传统方式:你给 AI 一段文字描述,告诉它"帮我写一个用户登录功能,需要包含注册、登录、登出,密码要加密,异常情况要处理"。AI 读完,大概知道你想干嘛,然后开始写。写出来的代码能跑,但细节可能一塌糊涂。

Agent Skills 的做法是:把作业指导书变成流程图,而不是说明书。

一个 Skill 长这样:

复制代码
## 测试技能

### Step 1: 写测试
Checkpoint:
- [ ] 测试覆盖率 > 80%
- [ ] 所有测试通过
- [ ] 无硬编码凭证

未通过?停止执行。

### Step 2: 验证测试确实运行
- 运行 `npm test`
- 截图测试输出
- 检查覆盖率报告

未通过?停止执行。

关键差异:AI 不能说"我写了测试",必须通过 Checkpoint 才能继续。


为什么在 HN 上火了

Addy Osmani 这篇 Agent Skills 文章冲了 303 分,151 条评论。

看完 HN 评论,总结几个要点:

实用派居多。 评论区没有太多人在争论"这是不是颠覆性创新",而是在讨论"这个设计能不能解决我的具体问题"。说明确实打到了痛点。

对抗 AI 借口文化。 HN 评论区提到最多的一个词是 anti-rationalization------反合理化。

AI 很擅长给自己找借口:

  • "这只是原型,先这样吧"
  • "测试稍后加上"
  • "重构太复杂,先不搞了"

Agent Skills 的做法是:把这些借口直接写进技能文档里,并附上反驳。"我会稍后添加测试"→ 稍后 = 永不,现在写。"能跑就行"→ 能跑不等于可维护。

这个设计太骚了。AI 看到借口,就会想起反驳。相当于给 AI 植入了一个内部监督机制。

渐进式披露节省算力。 传统方式下,AI 每次任务开始都要读取大量背景信息。Agent Skills 采用渐进式披露------AI 只在真正需要时才加载对应技能的知识,对长任务链特别有意义。


跟 MCP 的关系

这是 HN 评论里很多人问的问题。

简单说:MCP 解决"接得上"的问题,Skills 解决"干得对"的问题。

MCP(Model Context Protocol)是工具调用协议------让 AI 能调用外部工具。MCP 负责的是"AI 能不能做到"。

Agent Skills 是流程规范------让 AI 按正确顺序、正确标准完成任务。Skills 负责的是"AI 做的时候会不会偷懒"。

两者是互补关系,不是替代关系。MCP 是基础设施,Skills 是上层规范。


我的踩坑经验

用 AI 写代码这么久,有几个跟 Skills 理念非常吻合的经验:

验收标准必须可量化。 "测试要写得好"是废话,"测试覆盖率 > 80%"才是标准。把"做好"翻译成具体的数字指标,AI 执行起来才不会走偏。

每个节点都要有明确的退出条件。 AI 任务经常虎头蛇尾------开头认真,后面糊弄。给每个步骤设置 Checkpoint,未通过就停止,逼着 AI 在每个节点都交出合格产出。

让 AI 提供执行证据,不要主观判断。 AI 说"测试都通过了"------这是主观判断,不可信。AI 说"运行 npm test,输出显示 15 passed,0 failed,覆盖率 82%"------这是执行证据,可验证。Skills 的 Checkpoint 机制,就是强制 AI 提供证据而不是判断。


什么时候该用 Agent Skills

适合的场景:

  • 重复性高的任务流程(代码审查、测试生成、数据清洗)
  • 多步骤、长链路的任务(需要按顺序完成,不能跳步)
  • 团队需要固化最佳实践(把资深工程师的经验转成 Skills)
  • 对输出质量有明确标准的任务

不适合的场景:

  • 探索性任务(你都不知道答案是什么,让 AI 自由发挥)
  • 一次性小任务(写个 hello world 还要配 Skill 杀鸡用牛刀)
  • 创意类任务(写文案、做设计,Skills 规范太死板)

判断与行动建议

Agent Skills 是 2026 年最值得投入的 AI 工程化实践之一。

它的价值不在于技术多先进,而在于解决了一个很实在的问题:怎么让 AI 在实际干活的时候不摸鱼、不糊弄、不找借口。

如果你在带团队做 AI 应用落地,建议把 Skills 设计纳入开发规范:

先从高频任务开始,找到团队里重复执行最多的 3-5 个任务,为它们编写 Skills。把 Checkpoint 当成 CI,不过不了就不能继续------每个 Skill 的 Checkpoint 就是一道质量门。积累团队数字资产,Skills 是可以被版本管理、复用的团队知识,这是 AI 时代最重要的资产之一。


相关推荐
deephub1 小时前
BM25 + Vectors:为什么真实 RAG 系统通常两者都需要
人工智能·大语言模型·向量检索·rag·bm25
愚公搬代码1 小时前
【愚公系列】《AI漫剧创作一本通》006-剧本拆解,把小说改编为可落地的脚本(拆剧本,把故事变成可拍的文本)
人工智能·ai漫剧
郝学胜-神的一滴1 小时前
深度学习损失函数:从原理到实战之 Smooth L1 Loss
人工智能·pytorch·python·深度学习·机器学习·数据挖掘
yjfkpyu1 小时前
让 AI 不再按过期文档写代码:AgentLockDoc 开源了
人工智能·ai编程
OneBlock Community1 小时前
重磅!SEC & CFTC 联手“定义加密”,Polkadot 被写进规则!
大数据·人工智能
lazy熊1 小时前
初学者如何快速入门学会 Claude Code?
人工智能·gpt·ai编程
ForDreamMusk1 小时前
卷积层
人工智能·深度学习
流年似水~1 小时前
Copilot已死,Agent当立:2026年,程序员从“码字工“到“AI指挥官“的生存指南
人工智能·程序人生·语言模型·ai编程
珂朵莉MM1 小时前
第七届全球校园人工智能算法精英大赛-算法巅峰赛产业命题赛第二赛季优化题--遗传算法
人工智能·算法