大模型为什么需要 skill

像 OpenClaw、Claude Code 这类 agent 系统，表面上是在和大模型对话，真正做事时，用到的往往不只是 LLM 本身，也不只是预制的那几个功能。

任务一复杂，就会碰到一串很实际的问题：现有工具怎么接进来，新工具怎么安装和调用，多步流程怎么衔接，上一段结果怎么顺着传给下一段。

这些事，很多不是模型临场猜一猜就能稳定做好的。这里缺的，通常不是再补几句 prompt，而是把知识、工具和流程整理成一套可复用、可调用的东西。

这部分，就是 skill 要补上的内容。

一句话：skill 是给大模型补 how。

大模型常常不缺"是什么"，缺的是"这事该怎么做"。skill 做的，就是先把某类任务里关键的知识、步骤和约束整理好，需要时再接上工具、脚本和资料。

那为什么不直接把程序丢给模型？因为程序不会自己变成可用能力。模型还是得知道：这个工具解决什么问题，输入输出是什么，参数怎么传，什么时候该用，什么时候不该用。

比如一个 5000 行的 PDF 工具，模型每次都临时读代码再猜命令和参数，既慢也不稳。用 skill 先把这些信息整理好，调用就稳定很多。

从这个角度看，skill 更像大模型的外挂。它不替代工具，而是先把工具的用途、接口和用法讲清楚，减少模型临场猜测。

所以 skill 不只是 prompt，也不只是说明书，更像一个随用随取的工作流模块。

这个模块通常做三件事：

有些 skill 很轻，主要是在教方法；有些很重，后面直接连着命令行工具、本地脚本，甚至完整流程。

很多时候，缺的不是说明文档，而是软件和 agent 之间那层可稳定调用的中间层。

CLI（命令行接口层） 是这层的核心。它会把软件里零散的功能收敛成统一的子命令、参数格式和 JSON 输出。这样 agent 调用时不用猜命令怎么拼，执行一条子命令就能拿到结构化结果。

Harness 是包在 CLI 外面的整体适配结构。它不只是 CLI 脚本本身，还包括安装入口、REPL 模式（支持多轮有状态交互）、测试，以及一份说明文档，用来告诉 agent 这个工具能干什么、怎么启动、返回什么格式。

两者放在一起，才算把"软件"真正变成"可调用能力"。有了 CLI Harness，agent 对接的是清晰接口；没有的话，agent 面对的就还是一堆程序，只能临场猜。

完整结构通常是三层：

这样就能看清 skill 的位置：它不替代程序，也不替代适配层。它负责告诉模型，这套能力什么时候用、怎么用、结果怎么往下接。

很多热门 skill，本质上不是在发明新能力，而是在把现成能力包装成 LLM 能稳定调用的接口。它可以很轻，只是几段描述；也可以很重，后面直接连着完整的 harness 和流程。

归根结底，skill 做的是两件事：给模型补上 how，以及把相关知识、流程和工具稳定地交到大模型手里。