【智能体互联网的基石：AI操作系统架构、Agent通信协议与演进路径综述】

智能体互联网的基石：AI操作系统架构、Agent通信协议与演进路径综述

摘要：人工智能与操作系统的深度融合正在催生一场根本性的范式革命。传统操作系统正从被动的资源管理者演变为主动的意图理解者，智能体（Agent）正取代进程成为新的核心调度单元。本文系统综述了AIOS的五大核心特征（内核重塑、交互革命、端云协同、自进化能力、内生安全），深入剖析了Agent在其中作为调度原子、交互中枢、安全容器和进化触角的多重角色。在此基础上，重点分析了支撑这一演进的关键标准与协议体系，特别是对MCP、A2A、ACP和AONP四大智能体通信协议进行了深度比较研究，揭示其从"模型-工具"连接到"智能体互联网"的完整协议栈架构。最后，本文提出传统OS向AIOS演进的三阶段路线图，为未来智能操作系统的发展提供了系统化的理论框架和技术参考。

关键词：AIOS；智能体（Agent）；MCP协议；A2A协议；AONP协议；端云协同；内生安全；操作系统演进

1 引言

操作系统自诞生以来，始终扮演着计算机资源管理者的角色。从批处理到分时系统，从单机到网络化，每一次演进都在追求更高的资源利用率和更好的用户体验。然而，这些演进的本质始终未变：操作系统是一个被动执行精确指令的确定性机器。用户需要将自己的意图精确翻译为机器能理解的指令序列，操作系统则忠实地分配CPU时间片、管理内存页面、调度I/O请求。

大语言模型（LLM）的出现打破了这一范式。当机器能够理解自然语言、进行逻辑推理并自主规划任务时，操作系统的核心目标从"执行指令"跃迁为"达成意图"。这一转变催生了AI操作系统（AIOS）的概念------一个以大模型为"大脑"、以智能体为"公民"、以意图驱动为灵魂的新型操作系统。

然而，AIOS的实现并非单一技术的突破，而是一项涵盖架构设计、调度机制、记忆系统、安全模型和生态标准的系统性工程。当前，业界已涌现出多种AIOS架构方案和Agent通信协议，形成了从底层架构到上层协议的完整技术栈。本文旨在系统梳理这一领域的研究进展，厘清核心概念，比较关键技术路线，并展望未来演进方向。

2 AIOS的核心架构与关键特征

2.1 从进程到Agent：内核的重塑

传统操作系统内核的核心职责是管理进程和线程------它们是被动的执行单元，由外部事件或调度器触发，执行确定的代码路径。AIOS则将这一模型彻底颠覆：Agent成为新的"一等公民"。

Agent是具备自主性、反应性、社会性和主动性的智能执行单元。它不仅能执行代码，更能理解意图、拆解任务、调用工具并在多Agent间协作。AIOS内核因此进化为"意图驱动的调度中枢"，管理的资源也从CPU时间片和内存页扩展至LLM推理槽位、上下文窗口配额和工具调用权限。实验表明，基于此架构的调度器可在多Agent并发场景下实现最高2.1倍的执行加速 $1$ 。

2.2 AIOS的五大核心特征

综合当前业界研究与实践，成熟的AIOS普遍具备以下五大核心特征：

特征一：内核重塑------从资源管理到智能体调度。 传统OS管理CPU/内存等硬件资源，AIOS则将LLM作为系统"大脑"，将Agent提升为调度核心。内核需同时管理GPU、NPU等异构算力，并实现基于意图优先级的动态调度。典型案例包括中科创达滴水AIOS 2.1的AquaClaw架构 $2$ 。

特征二：交互革命------从GUI到多模态意图界面。 交互范式从被动的"点击-响应"升级为主动的多模态自然交互，系统能理解语音、手势、表情并预判用户需求。荣耀MagicOS 10等系统已展现出这一能力 $3$ 。

特征三：端云协同------从单一计算到混合智能。 AIOS根据任务延迟、隐私等级和算力需求，动态决策在端侧还是云端执行推理，实现无缝的混合计算。滴水AIOS支持14B大模型的端侧部署即为典型代表 $2$ 。

特征四：自进化能力------从固化功能到活的系统。 通过持续学习用户反馈，系统能自我迭代优化。荣耀MagicOS 10的场景理解能力在3个月内可从200个场景自进化至3000个，实现15倍增长 $3$ 。

特征五：内生安全------从被动防御到主动免疫。 安全模型从外挂防护转向系统内置的"免疫系统"，包括LLM输出预检、Agent沙箱隔离、能力令牌和内存安全语言（如Rust）的应用 $4$ 。

3 Agent在AIOS中的角色与作用

3.1 作为调度原子的Agent

在AIOS架构中，Agent是调度器眼中最小的可管理单元。每个Agent携带着优先级、依赖图、所需LLM推理资源（算力、上下文窗口、工具权限）等元信息，在内核的Agent调度队列中被排序和分配。这种调度抽象使得OS从面向"计算时间"转向面向"目标达成"------调度器不再问"下一个时间片给谁？"，而是问"哪个Agent的意图最紧急、依赖已满足、且有推理槽位可用？"。

3.2 作为交互中枢的Agent

在语言用户界面（LUI）成为主流的趋势下，Agent是交互闭环中的行动中枢。当LUI接收到一个复杂请求后，系统会创建一个对应的Agent，由它负责理解、拆解、调用具体服务，最终将结果以自然语言和多模态形式返回给用户。这种能力使Agent能够同时访问日历API、邮件API、数据库甚至IoT设备接口，将所有原子动作编织成一个流畅的任务流。

3.3 作为安全容器的Agent

AIOS的安全模型要求每个Agent都成为一个"带权限令牌的移动沙箱"，运行在隔离环境中。Agent的任何行为都不是"免检"的------当它试图访问敏感资源时，会触发六阶段安全管道（决策→选择→验证→审批→执行→审计） $5$ 。调度器和内核预检机制（如ProbeLogits $6$ ）会实时审查Agent行为的合法性。

3.4 作为进化触角的Agent

Agent是系统与真实世界交互、获取反馈的神经末梢。它使用OS提供的标准化记忆服务，将成功经验、用户偏好等存储为长期记忆，同时向云端反馈高质量行为数据参与全局模型的强化学习，形成正反馈学习闭环。

4 关键标准与协议体系

AI与OS的深度融合有赖于由标准、规范与协议构成的坚实基座。当前业界已形成覆盖"模型-工具"、"Agent-Agent"和"智能体互联网"的全域协议栈。

4.1 MCP：模型的"USB-C"接口

MCP（Model Context Protocol）由Anthropic于2024年11月推出，2025年12月捐赠给Linux基金会新成立的Agentic AI Foundation（AAIF） $7$ 。该协议采用客户端-服务器架构，基于JSON-RPC 2.0编码，定义了三大核心原语：Tools（可执行函数）、Resources（上下文数据）和Prompts（模板化消息）。MCP的目标是为大模型提供标准化的外部工具和数据源连接方式，被业界形象地称为"AI系统的USB-C接口"。2025-11-25版规范已引入增强型OAuth 2.0授权和Streamable HTTP传输升级 $8$ 。

4.2 A2A：Agent间的协作协议

A2A（Agent-to-Agent Protocol）由Google于2025年4月发布，2026年3月正式发布v1.0生产就绪版本，由Linux基金会托管，目前已获得150+组织支持 $9$ 。A2A采用三层协议栈架构：底层为Protocol Buffers定义的数据模型；中层为11个核心抽象操作（如SendMessage、GetTask等）；顶层支持JSON-RPC 2.0、gRPC、HTTP+JSON/REST等多种绑定。其核心原语包括Agent Cards（Agent能力描述）、Tasks（有状态工作单元）和Messages（结构化通信）。A2A已于2026年进入企业生产环境，应用案例涵盖Tyson Foods供应链自动化与ServiceNow AI Agent Fabric $9$ 。

4.3 ACP：联邦化通信框架

ACP（Agent Communication Protocol）由IBM Research的BeeAI平台提出，核心设计理念已并入A2A体系 $10$ 。ACP采用分层联邦架构，包含语义层（意图映射与SLA协商）、联邦发现层（去中心化注册与DID身份验证）和传输层（RESTful HTTP与MIME多类型消息）。其突出特点是支持去中心化身份验证（基于W3C DID标准）和针对资源受限环境设计的μACP变体 $10$ 。

4.4 AONP：智能体互联网的中国方案

AONP（Agent Open Network Protocol）由中国移动主导提出，是一套面向"智能体互联网（IoA）"的"五横一纵"协议簇 $11$ 。其中"五横"包括：SRMP（语义路由与组播通信协议）、M2TP（多模态传输协议）、AIDP（智能体与工具跨域发现协议）、SMIP（会话管理与调用协议）和A2P（智能体授权访问协议）；"一纵"指智能体网关AGW。AONP的独特价值在于其网络级视野和运营商基因，首次将算网资源调度、跨域寻址路由等基础网络能力纳入Agent协议设计，并已启动IETF、3GPP等国际标准布局 $11$ 。

4.5 四强协议对比

特征	MCP	A2A	ACP	AONP
核心发起方	Anthropic	Google	IBM/BeeAI	中国移动
核心视角	模型开发者	企业应用集成商	去中心化网络构建者	网络运营商
主要目标	模型连接标准化工具和数据	不同系统间Agent协作	通用Agent通信	大规模、跨域智能体互联网
架构风格	客户端-服务器(C/S)	混合(企业级集中式)	分层联邦	分层协议栈(强调网络能力)
核心能力	工具调用、资源暴露	任务管理、Agent发现	意图映射、联邦发现	广域互联、路由、算网协同
安全模型	应用层OAuth 2.0	企业级认证(API Key/mTLS)	DID+proof-of-intent	网络层+应用层+网关
标准化路径	Linux基金会AAIF	Linux基金会	已并入A2A	IETF, 3GPP, ITU-T
生态成熟度	最高(97M+生态)	高(150+组织)	萌芽(已合并)	快速发展中

四大协议并非竞争替代，而是分层互补：MCP解决"模型如何连接工具"的问题，A2A解决"Agent之间如何协作"的问题，ACP提供"边缘弱网通信"的补充能力，AONP则从网络层面构建"智能体互联网"的基础设施。四者共同构成了一个覆盖工具连接→Agent协作→联邦编排→网络级互联的完整协议栈。

5 安全与治理标准体系

除通信协议外，AIOS的安全可信还需依赖多层次治理标准。ISO/IEC 42001是首个AI管理体系（AIMS）国际标准，可与企业现有ISO 27001信息安全体系无缝集成 $12$ 。NIST AI RMF 1.0提供了完整的AI风险管理框架 $13$ 。在技术实操层面，OWASP Top 10 for LLM & Agent已成为开发者直接依赖的安全清单 $14$ 。

国内方面，中国在"全国一体化算力网"建设指引下，正推动《人工智能端云设备间模型协同系统规范》等国家标准制定 $15$ ，GB/T 45401.2-2025确立了包含云边端的三层分布式计算架构 $16$ 。

6 传统OS向AIOS的演进路径

基于当前技术成熟度和产业实践，传统操作系统向AIOS的演进可分为三个递进阶段：

阶段一：AI on OS（AI赋能期，2025年前）。在不改动系统内核的前提下，以应用形式部署AI能力。典型实践包括Windows Copilot、ONNX Runtime端侧推理。AI与OS完全隔离，无法感知系统状态，能力孤立。

阶段二：AI in OS（AI融合期，2025-2030年）。将AI能力深度集成到系统内核与服务层。核心改造包括：在内核旁构建AI调度子系统、内置向量数据库和图数据库作为记忆服务、增加LLM系统调用接口、实施六阶段安全管道。标志性产物是Agent运行时环境。当前Windows Server 2025通过Azure Arc实现的混合云集成、热补丁（Hotpatch）无需重启的更新能力，均属于此阶段的早期实践。

阶段三：AI as OS（AI原生期，2030年以后）。从零设计以Agent为原生执行单元、以LLM为调度核心的全新操作系统。传统内核退化为硬件抽象层（HAL），一切皆Agent。vivo蓝河操作系统采用Rust重写内核即为这一方向的先导探索 $4$ 。

演进阶段	Agent角色	内核改造	调度对象	安全模型	典型代表
AI on OS	应用层插件	无	无Agent调度	应用自身安全	Windows Copilot
AI in OS	系统级调度原子	新增AI子系统	Agent+进程并行	六阶段管道+沙箱	Azure Arc+Hotpatch
AI as OS	唯一执行单元	AI内核本身	纯Agent	语言级安全(Rust)	vivo蓝河内核

7 结论与展望

AIOS的出现标志着计算机系统从"精确计算"到"智能服务"的历史性转折。Agent作为新的核心调度单元，正在重新定义操作系统的架构、交互、安全和进化能力。MCP、A2A、ACP和AONP四大协议从不同视角出发，共同构建了Agent通信的标准化栈，为"智能体互联网"奠定了技术基座。

展望未来五年，AI与OS的深度融合将沿着三条主线展开：其一，协议栈持续完善，MCP、A2A、AONP等协议将在互操作性上持续增强，形成多协议共存的生态格局；其二，Agent运行时成为OS标准组件，系统将内置Agent SDK、记忆服务和意图引擎；其三，安全治理体系同步成熟，从代码级（Rust语言）到架构级（Agent沙箱）再到治理级（ISO 42001）的多层防御体系全面建立。

在这场变革中，中国正通过AONP等提案积极参与国际标准制定，推动算力网络与人工智能深度融合的"中国方案"成为全球共识。这场演进正在从根本上重新定义"计算"的意义------从执行指令到理解意图，从管理资源到成就目标。

参考文献

$1$ Rutgers University. AIOS: A Modular, Extensible and Efficient Architecture for LLM as an Operating System Service. 2025.

$2$ 中科创达. 滴水AIOS 2.1技术白皮书. 2025.

$3$ 荣耀. MagicOS 10技术架构白皮书. 2025.

$4$ vivo. 蓝河操作系统技术白皮书. 2025.

$5$ Linux Foundation. Agentic AI Foundation: Security Guidelines for Agent Systems. 2026.

$6$ ProbeLogits: Kernel-Level Pre-Interception for LLM Safety. arXiv, 2025.

$7$ Linux Foundation Agentic AI Foundation. Model Context Protocol Specification v2025-11-25. 2025.

$8$ Anthropic. MCP Authorization Server Discovery Enhancement. 2025.

$9$ Google. Agent-to-Agent Protocol v1.0 Specification. 2026.

$10$ IBM Research. BeeAI Platform and Agent Communication Protocol. 2025.

$11$ 中国移动. 智能体互联网开放网络协议（AONP）技术白皮书. 2025.

$12$ ISO/IEC. ISO/IEC 42001:2023 Information technology --- Artificial intelligence --- Management system. 2023.

$13$ NIST. Artificial Intelligence Risk Management Framework (AI RMF 1.0). 2023.

$14$ OWASP. OWASP Top 10 for LLM Applications & Agentic AI. 2025.

$15$ 全国信息技术标准化技术委员会. 人工智能端云设备间模型协同系统规范（征求意见稿）. 2025.

$16$ GB/T 45401.2-2025. 人工智能服务平台第2部分：分布式计算框架. 2025.