【卷卷观察】Agent Skills 为什么突然火了?我花了一晚上研究,结论有点反直觉

结论先甩:Agent Skills 不是什么新东西,但它解决了一个很实在的问题------怎么让 AI 不要找借口,真正把活干完。


我在用 AI 写代码的时候,最烦的不是 AI 写得慢,是 AI 写完之后跟你说"测试我稍后加上"。

然后就没有然后了。

这个问题我遇到太多次了。AI 写的代码逻辑看起来没问题,但测试覆盖率 0%、边界情况没考虑、错误处理是空的。你让 AI 补,AI 说"好的我补",然后生成一堆看起来像测试的代码,实际上根本没跑通。

直到我看到 Addy Osmani 写的 Agent Skills 文章,我才意识到:问题不在 AI 本身,在于我们给 AI 的技能描述太水了。


什么是 Agent Skills

简单说,Agent Skills 就是给 AI Agent 用的"标准作业指导书"。

传统方式:你给 AI 一段文字描述,告诉它"帮我写一个用户登录功能,需要包含注册、登录、登出,密码要加密,异常情况要处理"。AI 读完,大概知道你想干嘛,然后开始写。写出来的代码能跑,但细节可能一塌糊涂。

Agent Skills 的做法是:把作业指导书变成流程图,而不是说明书。

一个 Skill 长这样:

复制代码
## 测试技能

### Step 1: 写测试
Checkpoint:
- [ ] 测试覆盖率 > 80%
- [ ] 所有测试通过
- [ ] 无硬编码凭证

未通过?停止执行。

### Step 2: 验证测试确实运行
- 运行 `npm test`
- 截图测试输出
- 检查覆盖率报告

未通过?停止执行。

关键差异:AI 不能说"我写了测试",必须通过 Checkpoint 才能继续。


为什么在 HN 上火了

Addy Osmani 这篇 Agent Skills 文章冲了 303 分,151 条评论。

看完 HN 评论,总结几个要点:

实用派居多。 评论区没有太多人在争论"这是不是颠覆性创新",而是在讨论"这个设计能不能解决我的具体问题"。说明确实打到了痛点。

对抗 AI 借口文化。 HN 评论区提到最多的一个词是 anti-rationalization------反合理化。

AI 很擅长给自己找借口:

  • "这只是原型,先这样吧"
  • "测试稍后加上"
  • "重构太复杂,先不搞了"

Agent Skills 的做法是:把这些借口直接写进技能文档里,并附上反驳。"我会稍后添加测试"→ 稍后 = 永不,现在写。"能跑就行"→ 能跑不等于可维护。

这个设计太骚了。AI 看到借口,就会想起反驳。相当于给 AI 植入了一个内部监督机制。

渐进式披露节省算力。 传统方式下,AI 每次任务开始都要读取大量背景信息。Agent Skills 采用渐进式披露------AI 只在真正需要时才加载对应技能的知识,对长任务链特别有意义。


跟 MCP 的关系

这是 HN 评论里很多人问的问题。

简单说:MCP 解决"接得上"的问题,Skills 解决"干得对"的问题。

MCP(Model Context Protocol)是工具调用协议------让 AI 能调用外部工具。MCP 负责的是"AI 能不能做到"。

Agent Skills 是流程规范------让 AI 按正确顺序、正确标准完成任务。Skills 负责的是"AI 做的时候会不会偷懒"。

两者是互补关系,不是替代关系。MCP 是基础设施,Skills 是上层规范。


我的踩坑经验

用 AI 写代码这么久,有几个跟 Skills 理念非常吻合的经验:

验收标准必须可量化。 "测试要写得好"是废话,"测试覆盖率 > 80%"才是标准。把"做好"翻译成具体的数字指标,AI 执行起来才不会走偏。

每个节点都要有明确的退出条件。 AI 任务经常虎头蛇尾------开头认真,后面糊弄。给每个步骤设置 Checkpoint,未通过就停止,逼着 AI 在每个节点都交出合格产出。

让 AI 提供执行证据,不要主观判断。 AI 说"测试都通过了"------这是主观判断,不可信。AI 说"运行 npm test,输出显示 15 passed,0 failed,覆盖率 82%"------这是执行证据,可验证。Skills 的 Checkpoint 机制,就是强制 AI 提供证据而不是判断。


什么时候该用 Agent Skills

适合的场景:

  • 重复性高的任务流程(代码审查、测试生成、数据清洗)
  • 多步骤、长链路的任务(需要按顺序完成,不能跳步)
  • 团队需要固化最佳实践(把资深工程师的经验转成 Skills)
  • 对输出质量有明确标准的任务

不适合的场景:

  • 探索性任务(你都不知道答案是什么,让 AI 自由发挥)
  • 一次性小任务(写个 hello world 还要配 Skill 杀鸡用牛刀)
  • 创意类任务(写文案、做设计,Skills 规范太死板)

判断与行动建议

Agent Skills 是 2026 年最值得投入的 AI 工程化实践之一。

它的价值不在于技术多先进,而在于解决了一个很实在的问题:怎么让 AI 在实际干活的时候不摸鱼、不糊弄、不找借口。

如果你在带团队做 AI 应用落地,建议把 Skills 设计纳入开发规范:

先从高频任务开始,找到团队里重复执行最多的 3-5 个任务,为它们编写 Skills。把 Checkpoint 当成 CI,不过不了就不能继续------每个 Skill 的 Checkpoint 就是一道质量门。积累团队数字资产,Skills 是可以被版本管理、复用的团队知识,这是 AI 时代最重要的资产之一。


相关推荐
用户5191495848451 小时前
libcurl Headers API 释放后重利用漏洞:跨请求复用头句柄导致堆内存安全风险
人工智能·aigc
踩蚂蚁1 小时前
自定义语音唤醒词:从训练到部署的完整链路实践
人工智能
用户5191495848451 小时前
CVE-2025-1094 PostgreSQL SQL注入与WebSocket劫持远程代码执行利用工具
人工智能·aigc
IT_陈寒2 小时前
SpringBoot自动配置这个坑,我踩进去又爬出来了
前端·人工智能·后端
冬奇Lab14 小时前
Agent 系列(23):Web Agent——让 Agent 真正浏览网页
人工智能·llm·agent
冬奇Lab14 小时前
每日一个开源项目(第135篇):codebase-memory-mcp - 给 AI Agent 一张代码库的知识图谱
人工智能·开源·llm
IT_陈寒16 小时前
JavaScript的闭包把我坑惨了,说好的内存会自动回收呢?
前端·人工智能·后端
jooloo20 小时前
Codex 间歇性 400 之谜:一条对话里,它为什么有时候用 chat/completions,有时候切到 responses?
人工智能