什么是functioncall,mcp,skills?一文作简单解析(随手记)

本文参考作者 Erlich 对于目前AI技术演进的视频解说,通过Get笔记整理而来。

意在梳理目前有关于大模型演进史,从对话到function call,再到mcp,agent sdk,直至如今skills的基础认知。

核心技术演进脉络

一、技术发展阶段划分

  1. 基础对话阶段 :早期大模型的一问一答式交互(如DeepSeek基础功能),用户需全程值守,无法获取训练数据外信息。
  2. 工具调用阶段 :引入Function Call技术,通过API(如Tavily搜索)扩展外部信息获取能力,但仍需人工触发。
  3. 模块化集成阶段 :发展出MCP协议(模块化能力平台),支持本地配置与远端服务调用,实现类似如今不同服务提供的远程API。可连接文档编辑、系统控制等多元功能。
  4. 智能代理阶段Agent SDK/Claude Code的出现,构建包含本地资源、外部工具和目标规划的综合环境,实现自动化任务处理。
  5. 技能化应用阶段 :当前的Skills技术,通过专业知识结构化封装与渐进式披露,降低专业门槛,实现能力普惠。

二、关键技术对比分析

技术阶段 核心能力 典型应用 局限性
基础对话 文本生成与理解 客服问答、信息查询 无外部交互能力,需人工全程参与
Function Call 外部API调用 网络搜索(Tavily)、数据查询 需手动触发,功能单一
MCP 多工具模块化集成 文档编辑、系统控制(如飞格玛、Google Docs) 仍需人工值守与指令输入
Agent SDK 自动化任务规划 Cloud Code代码生成、开发方案设计 要求用户具备专业知识与编程能力
Skills 专业知识结构化封装 行业标准化流程执行、自动化报告生成 依赖Agent环境支持,需解决上下文管理问题

💡 Skills技术深度解析

一、核心解决问题

  1. 知识传递效率:通过结构化层级组织,将20万字行业知识转化为按需加载的模块化技能包。
  2. 上下文管理优化:采用渐进式披露机制,避免大模型上下文(如Claude 4.5的200K tokens限制)被过度占用。
  3. 专业门槛降低:使非技术人员可通过标准化技能模板使用复杂功能,无需理解底层实现逻辑。

二、技术架构关键要素

  • Trigger机制:Agent通过检索Skills元数据(metadata),自动匹配任务需求与技能模板。
  • 执行规范:包含行业特定逻辑步骤与判断标准,指导大模型按专业流程处理任务。
  • 脚本化组件:内置标准化执行脚本(如格式转换、数据上传),避免大模型生成不可控代码。
相关推荐
AlfredZhao4 小时前
AI 编程工作总结:从体验问题到模块能力建设
ai·codex
cup111 天前
[技术复盘] Windows Python 打包实战:Nuitka 环境踩坑总结与 CI 自动化构建全指南
python·ai·环境变量·ci·nuitka·skill
IT王师傅1 天前
从 豆包 到 Codex CLI:一名普通开发者的 AI 工具进化路线
ai·codex cli·openclaw
岳小哥AI1 天前
Siri要接入AI了,苹果手机上一句话让GPT写文案、DeepSeek写代码的时刻来了
ai·ai基础
Artech1 天前
[MAF预定义的AIContextProvider-03]ChatHistoryMemoryProvider——赋予Agent从经验中学习的能力
ai·c#·agent·memory·maf
哥布林学者2 天前
深度学习进阶(三十一)FlashAttention:IO 感知的精确注意力
机器学习·ai
岳小哥AI2 天前
AI大模型"幻觉"从何而来?解密GPT-4、DeepSeek一本正经胡说八道的真相
ai·ai基础
JaguarJack3 天前
Openai Codex 重大更新 已支持接入任意开源大模型
ai·openai·codex
Artech3 天前
[MAF预定义的AIContextProvider-02]AgentSkillsProvider——将Agent Skills引入MAF
ai·c#·agent·agent skills·maf
岳小哥AI3 天前
读懂计算机视觉CV、语言感知(ASR/TTS)、多模态,就能理解AI是如何“看到”与“听到”世界的
ai·ai基础