大模型为什么需要 skill

像 OpenClaw、Claude Code 这类 agent 系统,表面上是在和大模型对话,真正做事时,用到的往往不只是 LLM 本身,也不只是预制的那几个功能。

任务一复杂,就会碰到一串很实际的问题:现有工具怎么接进来,新工具怎么安装和调用,多步流程怎么衔接,上一段结果怎么顺着传给下一段。

这些事,很多不是模型临场猜一猜就能稳定做好的。这里缺的,通常不是再补几句 prompt,而是把知识、工具和流程整理成一套可复用、可调用的东西。

这部分,就是 skill 要补上的内容。

1 为什么不能直接把程序丢给模型

一句话:skill 是给大模型补 how。

大模型常常不缺"是什么",缺的是"这事该怎么做"。skill 做的,就是先把某类任务里关键的知识、步骤和约束整理好,需要时再接上工具、脚本和资料。

那为什么不直接把程序丢给模型?因为程序不会自己变成可用能力。模型还是得知道:这个工具解决什么问题,输入输出是什么,参数怎么传,什么时候该用,什么时候不该用。

比如一个 5000 行的 PDF 工具,模型每次都临时读代码再猜命令和参数,既慢也不稳。用 skill 先把这些信息整理好,调用就稳定很多。

2 skill 到底在补什么

从这个角度看,skill 更像大模型的外挂。它不替代工具,而是先把工具的用途、接口和用法讲清楚,减少模型临场猜测。

所以 skill 不只是 prompt,也不只是说明书,更像一个随用随取的工作流模块。

这个模块通常做三件事:

  • 让 LLM 知道什么时候该用这套东西

  • 告诉它这类任务该怎么做

  • 如果需要,再接上外部知识和工具

有些 skill 很轻,主要是在教方法;有些很重,后面直接连着命令行工具、本地脚本,甚至完整流程。

3 CLI 和 Harness

很多时候,缺的不是说明文档,而是软件和 agent 之间那层可稳定调用的中间层。

CLI(命令行接口层) 是这层的核心。它会把软件里零散的功能收敛成统一的子命令、参数格式和 JSON 输出。这样 agent 调用时不用猜命令怎么拼,执行一条子命令就能拿到结构化结果。

Harness 是包在 CLI 外面的整体适配结构。它不只是 CLI 脚本本身,还包括安装入口、REPL 模式(支持多轮有状态交互)、测试,以及一份说明文档,用来告诉 agent 这个工具能干什么、怎么启动、返回什么格式。

两者放在一起,才算把"软件"真正变成"可调用能力"。有了 CLI Harness,agent 对接的是清晰接口;没有的话,agent 面对的就还是一堆程序,只能临场猜。

4 三层怎么配合

完整结构通常是三层:

  • 最底下是真实软件或真实后端

  • 中间是 CLI harness 这类可执行的适配层

  • 最上面才是让 agent 知道怎么触发、怎么调用、怎么组织流程的 skill

这样就能看清 skill 的位置:它不替代程序,也不替代适配层。它负责告诉模型,这套能力什么时候用、怎么用、结果怎么往下接。

很多热门 skill,本质上不是在发明新能力,而是在把现成能力包装成 LLM 能稳定调用的接口。它可以很轻,只是几段描述;也可以很重,后面直接连着完整的 harness 和流程。

归根结底,skill 做的是两件事:给模型补上 how,以及把相关知识、流程和工具稳定地交到大模型手里。

相关推荐
deephub10 分钟前
Agent = Model + Harness:模型决定上限Harness 决定下限
人工智能·大语言模型·agent·harness
GalenZhang88814 分钟前
Hermes Agent v0.14.0:AI Agent 基建时代正式到来
人工智能·hermes
俊哥V18 分钟前
每日 AI 研究简报 · 2026-05-17
人工智能·ai
johnrui21 分钟前
RAG系统“入口”和“出口”的进化
人工智能
cyyt25 分钟前
深度学习周报(5.11~5.17)
人工智能·深度学习
鹏子训33 分钟前
MemoryOS:开源时序知识图谱AI记忆系统
人工智能·知识图谱·记忆模块·ai记忆·memoryos·时序记忆
泰迪智能科技35 分钟前
高校人工智能与大数据产品体系及解决方案介绍
大数据·人工智能
GEO从入门到精通37 分钟前
学习GEO资料要多久能看到效果?
人工智能·学习
沪漂阿龙43 分钟前
面试题详解:Agent 记忆管理全解析——历史对话获取、摘要记忆、事实记忆、知识图谱记忆一次讲透
大数据·人工智能·知识图谱