对全球11种主流智能体通信协议的总结与对比,这些协议共同构成了未来智能体互联网(IoA)的底层通信基础,旨在解决AI智能体在不同场景下的标准化交互问题。
一、协议详细对比与作用
| 协议/项目 | 提出/主导方 | 核心作用与定位 | 技术架构与关键特性 | 适用场景 |
|---|---|---|---|---|
| MCP | Anthropic | AI与外部世界的"USB-C"接口。为AI模型与外部工具、数据源(如数据库、API)的交互提供标准化框架,解决模型能力拓展问题,减少对专有集成的依赖。 | 客户端-服务器(C/S)架构 : • 主机端 :如Claude Desktop、IDE,为用户提供交互界面。 • 客户端 :嵌入LLM中,作为LLM与MCP服务器的桥梁。 • 服务器 :提供特定工具和数据访问能力,可本地或远程部署。 • 通信 :所有消息采用JSON-RPC 2.0格式,支持请求、结果、错误和通知。流程包括初始化、能力发现、调用执行和结果返回。 | 企业知识库问答、编程助手对接代码库/IDE、办公助手访问日历/邮件等需要大模型安全、标准化调用外部工具和数据的场景。 |
| A2A | Google(捐赠给Linux基金会) | **智能体间的"通用语言"**。旨在打破不同AI系统间的壁垒,实现跨供应商、跨框架智能体的无缝协作与任务编排,是企业级智能体协作的关键协议。 | 灵活的P2P交互方式 : • 能力发现 :通过标准化的智能体卡片(Agent Card) (JSON格式)公开智能体能力。 • 任务生命周期管理 :围绕任务(Task) 构建,支持状态流转(提交→处理中→需输入→完成/失败),通过SSE或Webhook实现实时更新。 • 多模态协作 :支持文本、音频、视频、网页表单等多种内容形式,双方可协商输出格式。 • 安全认证:内置OAuth2、JWT、API Key等多种企业级认证方案,数据默认TLS加密。 | 企业级复杂任务拆解与多智能体协同、需要长时间执行并实时同步状态、涉及多模态内容交互的协作场景。 |
| AG-UI | CopilotKit团队 | **智能体与前端应用的"对话标准"**。解决AI智能体与用户界面(UI)交互的标准化问题,实现实时双向通信与状态同步,提升开发效率和用户体验。 | 分层架构(协议层-传输层-适配层) : • 协议层 :定义标准化JSON事件类型,覆盖生命周期、内容、工具调用、状态管理。 • 传输层 :支持SSE (单向推送,如进度更新)、WebSocket (双向实时通信)、Webhook (异步通知)。 • 适配层:提供Python/TypeScript后端SDK(适配LangGraph、CrewAI等框架)和React Hooks前端组件库。 | 需要智能体处理过程对用户可见、允许用户实时干预、且要求Web/App前端与智能体后端状态无缝同步的交互式应用。 |
| ANP | 国际人工智能联盟(IAIC) | **智能体互联网的"HTTP"**。旨在构建开放、安全、高效的去中心化智能体协作网络,重新定义机器间的对等交互规则。 | 三层纯P2P架构 : 1. 身份与加密通信层 :基于W3C DID 标准,实现分布式身份认证和端到端加密。 2. 元协议层 :智能体间动态协商具体的通信协议。 3. 应用协议层 :基于语义网技术描述智能体能力,实现语义化发现与高效交互。 • 交互流程:包括智能体发现、搜索、身份验证请求、验证和服务交互。 | 跨机构、跨地域的去中心化协作场景(如智慧城市管理系统),强调网络弹性、避免单点故障和高度自主性。 |
| AGNTCY项目 | 思科Outshift(捐赠给Linux基金会) | **智能体协作的"基础设施平台"**。提供开放、通用的基础设施,涵盖智能体身份、发现、消息传递、可观测性等核心组件,提升大规模多智能体系统协同的透明度与信任度。 | 九大核心组件构成的平台 : • 智能体身份 & 开放智能体模式框架(OASF) :基于OCI的数据模型,描述并唯一标识智能体。 • 智能体目录 :支持公告与发现,可同步构成资源清单。 • 语义/句法SDK :支持A2A、MCP、ACP等多种协议,实现语义数据适配和API桥接。 • 消息传递SDK :基于SLIM协议 (扩展gRPC),支持发布/订阅等安全低延迟通信。 • 智能体工作流服务器 、可观测性与评估 、集成安全工具。 | 需要安全、可靠、可观测的大规模多智能体系统协同的复杂企业环境,作为底层基础设施支撑上层协议。 |
| ACP | 社区(现为Linux基金会A2A一部分) | **智能体互操作的"连接器"**。为智能体、应用与人类之间的通信提供标准化接口,支持从单智能体到复杂多智能体工作流的各种灵活架构。 | 灵活的单/多服务器架构 : • 核心组件 :ACP客户端和ACP服务器,单个进程可兼具两者角色。 • 部署模式 : - 基础单智能体 :客户端通过REST接口直连单个智能体。 - 单服务器多智能体 :单个服务器托管多个智能体,共享资源,集中管控。 - 分布式多服务器 :客户端与多个独立服务器通信,实现高扩展性和故障隔离。 - 高级多智能体编排:通过"路由智能体"分解、路由、聚合复杂任务。 | 灵活部署的智能体系统,从简单的客户端-服务器调用到需要复杂工作流编排和任务分解的高级多智能体协同场景。 |
| LMOS | Eclipse基金会 | **智能体互联网的"操作系统"**。致力于构建开放、可互操作的生态系统,让不同组织的智能体和工具能轻松发布、发现和互连。 | 三层架构 : 1. 应用协议层 :定义交互规则、发现机制、智能体描述格式(JSON-LD )和WebSocket子协议。 2. 传输协议层 :动态协商并建立通信协议(如HTTP、MQTT)。 3. 身份与安全层 :基于W3C DID 实现去中心化身份认证,兼容OAuth2等机制。 • 核心功能:统一描述、灵活元数据传播、全场景发现、去中心化身份、自适应通信、群组管理。 | 需要跨平台、跨技术栈实现智能体与工具广泛互联互通的开放生态场景,类似于智能家居的Matter协议。 |
| AITP | NEAR基金会 | **专注价值交换的"交互与交易协议"**。规范智能体间的复杂交互与可信交易流程,特别适用于需要跨信任边界进行数据、服务、资源交换的场景。 | 以聊天线程和能力为核心 : • 线程 :多方通信的主要对象,包含所有交换信息,支持灵活增删参与者,保持上下文。 • 能力 :针对特定场景的标准化消息规范,已定义多模态交互 、生成式UI 、支付集成 、人机协同 、跨链交互五大模块。智能体声明自身能力,供他方利用。 | 去中心化环境中的电商、支付、数据交易等涉及价值转移和需要结构化交互(如支付请求、UI生成)的多智能体协作。 |
| NANDA项目 | 麻省理工学院(MIT) | **去中心化智能体网络的"基础架构"**。旨在解决未来数万亿智能体在发现、验证、协调时的瓶颈,提供去中心化的身份、注册、路由、经济激励等全栈协议。 | 多层级栈式架构 : 1. 加密身份与信任 :基于公钥/私钥对的不可伪造身份。 2. 去中心化智能体注册中心 :联邦式架构,映射智能体名称到结构化元数据(AgentFacts)。 3. 动态路由与解析 :为智能体匹配最优端点,考量可用性、信任分数等。 4. 语义化发现与匹配 :根据技能、信任等级等条件筛选智能体。 5. 安全证明与审计追踪 :签名记录于分布式账本,支持零知识证明。 6. 内置经济激励:预留经济层接口,奖励贡献者。 | 面向未来超大规模、完全去中心化、需要内置经济模型和强大发现与信任机制的全球智能体互联网基础层。 |
| Agents.json | WildCard AI团队 | AI智能体调用API的"说明书" 。基于OpenAPI扩展,通过定义flows和links,让智能体能以正确顺序和逻辑调用互联网服务的API,保证多步骤调用的可靠性。 |
对OpenAPI的轻量扩展 : • 核心概念 :引入 **flows** (实现特定业务目标的API调用序列)和 **links** (定义操作间的衔接方式)。 • 部署 :API提供商将文件置于/.well-known/agents.json路径下。 • 特点:自然语言驱动交互、无状态设计、低部署成本、对现有Web友好(标准HTTP文件)。 |
网站或服务提供商希望让其API更容易、更可靠地被AI智能体理解和调用,特别是需要多步骤API调用的业务场景。 |
| Agora协议 | 牛津大学研究团队 | 让智能体"自创语言"的元协议。不规定固定格式,而是允许智能体通过自然语言协商,动态生成并执行最适合当前任务的通信协议,追求极致的灵活性。 | 双层架构 : 1. 自然语言协商层 :智能体通过自然语言交换能力与需求,确保最大兼容性。 2. 动态协议执行层 :LLM将协商结果转化为可执行的例行程序(Routine) (如Python/JavaScript代码),包含数据验证、格式转换等逻辑。 • 特点:彻底的去中心化,智能体既是协议使用者也是创建者。 | 研究性、高度异构或需求未知的多智能体环境,用于概念验证(如LLM自动生成协议),未来可能应用于规模和异质性极高的智能体网络。 |
二、总结
智能体互联网正在形成,没有单一协议能够支撑未来万亿级智能体的所有复杂交互 。这些协议和项目是互补与协同的关系,共同构建一个无边界、自进化的智能协作网络:
-
解决不同层面的问题:
- 连接外部世界:MCP, Agents.json
- 智能体间协作:A2A, ANP, AITP, Agora, ACP
- 人机交互界面:AG-UI
- 底层基础设施与生态:AGNTCY, LMOS, NANDA
-
生态融合趋势明显:例如,AGNTCY项目明确支持集成A2A、MCP、ACP等多种协议;ACP已成为A2A协议的一部分;NANDA旨在为A2A、MCP等上层协议提供去中心化网络基础。
-
设计哲学光谱:
- 标准化与效率优先:A2A、MCP等提供明确规范,利于企业部署和互操作。
- 灵活性与进化优先:Agora、ANP等采用更开放、去中心化的设计,追求长期适应性和网络自治。
未来的智能体互联网将是一个多层次、协议互补的混合生态。开发者或组织应根据具体场景(如是否需要强一致性、是否涉及价值交换、是否要求去中心化等)选择合适的协议组合,而像AGNTCY、LMOS这样的项目正致力于让这些异构协议能够协同工作。这场演进的目标是让智能体从孤立的工具,转变为数字世界中能够自主、安全、高效协作的新节点。