
Agent Skill ( 智能体 技能) ,或者常被称为 Tool (工具),是让 AI Agent 从"只会聊天的软脚虾"进化成"能干实事的行动派"的关键组件。
如果把 LLM ( 大模型 ) 比作 Agent 的大脑 (负责思考和规划); 把 Memory (记忆) 比作 Agent 的笔记本 (负责记录); 那么 Agent Skill 就是 Agent 的双手 和工具箱。
它是 Agent 用于与外部世界交互 、执行具体操作的能力模块。
1.🛠️ 为什么需要 Skill?大模型的缺陷
大语言模型(如 GPT-4)本质上只是一个文本生成器。它有两个先天缺陷:
-
无法联网/实时性差:它不知道现在的天气,也不知道今天的股价(它的知识截止于训练结束那天)。
-
无法操作外部世界:它不能帮你发邮件、不能操作 Excel、不能在数据库里删改数据。它只能输出文字。
Agent Skill 的出现,就是为了赋予 大模型 "行动力"。
2.⚙️ Skill 是怎么工作的?(Function Calling)
在技术实现上,Agent Skill 通常通过 Function Calling (函数调用) 机制来运作。
流程如下:
-
用户 指令:"帮我查一下北京明天的天气。"
-
大脑思考 ( LLM ) :模型分析后发现:"我不知道天气,但我手里有一个叫
get_weather的技能(函数)。" -
调用技能 (Action):模型生成一段特殊的 JSON 代码:
-
JSON:
{ "tool": "get_weather", "location": "Beijing", "date": "tomorrow" }
-
执行技能 (Execution):系统(如 LangChain)运行这段代码,去调用真实的天气 API。
-
获取结果 (Observation):API 返回数据:"25度,晴"。
-
最终回答 (Response):模型结合结果,回答用户:"北京明天是晴天,气温 25 度。"
3.🧰 Skill 的常见类型
一个强大的 Agent 通常挂载了多种技能,就像蝙蝠侠的腰带:
A. 信息获取类 (Information Retrieval)
-
Web Search (联网搜索):Google/Bing 搜索技能。
-
RAG (知识库检索):去企业内部文档里查资料。
-
SQL Query:查询数据库里的销售报表。
B. 逻辑计算类 (Computation)
-
Calculator (计算器):解决大模型算术不准的问题。
-
Code Interpreter (代码 解释器 ):写一段 Python 代码并运行,用来画图或处理 Excel。
C. 外部行动类 (External Action)
-
API Integration:调用钉钉/飞书发消息,调用 Jira 建工单。
-
OS Control:在电脑上模拟鼠标点击、键盘输入(如 RPA)。
4.🧩 Skill 与 Tool 的区别
这两个词经常混用,但在某些架构(如 AutoGPT, BabyAGI)中有一点细微区别:
-
Tool (工具):原子化的、单一的功能。
- 例子:"Google 搜索"、"Python 运行环境"。
-
Skill (技能) :通常指工具 + 流程的组合,是更高层级的能力。
- 例子:"写研报技能"。这个技能内部可能包含了"搜索工具"、"阅读工具"和"写作工具"的组合调用。
总结
Agent Skill 是 AI 的**"外挂"** 。
它让 AI 突破了"对话框"的限制,真正成为了能帮你买票、订餐、写代码、分析数据的数字员工。衡量一个 Agent 强不强,主要就看它挂载了多少 Skill,以及它的大脑能不能精准地调度这些 Skill。