本文参考作者 Erlich 对于目前AI技术演进的视频解说,通过Get笔记整理而来。
意在梳理目前有关于大模型演进史,从对话到function call,再到mcp,agent sdk,直至如今skills的基础认知。
核心技术演进脉络
一、技术发展阶段划分
- 基础对话阶段 :早期大模型的一问一答式交互(如DeepSeek基础功能),用户需全程值守,无法获取训练数据外信息。
- 工具调用阶段 :引入Function Call技术,通过API(如Tavily搜索)扩展外部信息获取能力,但仍需人工触发。
- 模块化集成阶段 :发展出MCP协议(模块化能力平台),支持本地配置与远端服务调用,实现类似如今不同服务提供的远程API。可连接文档编辑、系统控制等多元功能。
- 智能代理阶段 :Agent SDK/Claude Code的出现,构建包含本地资源、外部工具和目标规划的综合环境,实现自动化任务处理。
- 技能化应用阶段 :当前的Skills技术,通过专业知识结构化封装与渐进式披露,降低专业门槛,实现能力普惠。
二、关键技术对比分析
| 技术阶段 | 核心能力 | 典型应用 | 局限性 |
|---|---|---|---|
| 基础对话 | 文本生成与理解 | 客服问答、信息查询 | 无外部交互能力,需人工全程参与 |
| Function Call | 外部API调用 | 网络搜索(Tavily)、数据查询 | 需手动触发,功能单一 |
| MCP | 多工具模块化集成 | 文档编辑、系统控制(如飞格玛、Google Docs) | 仍需人工值守与指令输入 |
| Agent SDK | 自动化任务规划 | Cloud Code代码生成、开发方案设计 | 要求用户具备专业知识与编程能力 |
| Skills | 专业知识结构化封装 | 行业标准化流程执行、自动化报告生成 | 依赖Agent环境支持,需解决上下文管理问题 |
💡 Skills技术深度解析
一、核心解决问题
- 知识传递效率:通过结构化层级组织,将20万字行业知识转化为按需加载的模块化技能包。
- 上下文管理优化:采用渐进式披露机制,避免大模型上下文(如Claude 4.5的200K tokens限制)被过度占用。
- 专业门槛降低:使非技术人员可通过标准化技能模板使用复杂功能,无需理解底层实现逻辑。
二、技术架构关键要素
- Trigger机制:Agent通过检索Skills元数据(metadata),自动匹配任务需求与技能模板。
- 执行规范:包含行业特定逻辑步骤与判断标准,指导大模型按专业流程处理任务。
- 脚本化组件:内置标准化执行脚本(如格式转换、数据上传),避免大模型生成不可控代码。