一句话总览:
RAG补知识、Function Calling动手做事、Skill打包能力、Agent自主统筹、MCP统一接口互联
1. Agent(智能体)
定义 :以大模型为大脑,自带规划、记忆、决策、工具调用、复盘闭环 ,自主完成多步骤复杂任务的AI系统
- 核心:感知→推理→行动→反馈循环,不用人一步步指挥
- 解决:AI只会一问一答,不会主动干活、拆解复杂目标
- 例子:查天气→判断下雨→自动发请假邮件
- 类比:AI项目经理、全自动私人助理
2. MCP(Model Context Protocol,模型上下文协议)
定义 :AI与外部工具tool 、数据源交互的通用标准化通信协议 ,AI界USB-C万能接口
- 底层:基于JSON-RPC 2.0,统一工具/数据接入规范
- 解决:以前每个Agent、每个工具都要写定制胶水代码,重复开发、不互通
- 价值:一次封装工具,所有支持MCP的Agent都能即插即用、跨平台复用
- 类比:所有AI共用一套通用插头,不用反复做转接头
3. Skill(技能)
定义 :把固定场景、多步流程、函数+RAG+逻辑编排打包封装成可复用、标准化AI能力模块
- 本质:Agent可直接调用的业务能力包
- 例子:报销审核技能、合同解析技能、数据分析技能,pdf解析技能
- 区别:单Function是单个动作;Skill是一整套完整业务流程
- 作用:降低Agent开发成本,能力可共享、复用、上架
4. Function Calling(函数调用/工具调用)
定义 :agent与大模型之间关于工具调用约定的对话格式,大模型输出结构化JSON指令 ,主动调用外部API、函数、工具执行实际操作
- 模型只生成调用格式,不直接执行;由后端代码跑工具、返回结果
- 解决:大模型只会说话,不能查天气、查数据库、算数据、发消息、操作文件
- 流程:用户提问→模型判断要调用工具→输出函数参数→后端执行→结果回填→模型总结回答
- 类比:给AI装上手脚,能触碰真实世界系统
5. RAG(Retrieval-Augmented Generation,检索增强生成)
定义 :回答前先从私有/实时知识库向量检索相关文档,再结合资料生成答案
- 流程:文档分块→向量化入库→问题检索匹配→带入上下文生成
- 解决:模型知识过时、私有文档无法学习、胡说八道幻觉、超长文档问答
- 优势:不用微调模型、更新资料快、答案可溯源、事实精准
- 类比:AI随身资料库、实时研究员,回答必查资料不瞎编
五者关系一眼看懂
- RAG :给AI精准知识(解决不知道)
- Function Calling :给AI动手能力(解决做不到)
- Skill :把知识+动作打包成业务技能(标准化复用)
- Agent :统筹所有Skill/RAG/工具,自主规划完成复杂任务
- MCP :统一所有Agent、工具、知识库的通信接口,全域互联互通
