智能体互联网的基石:AI操作系统架构、Agent通信协议与演进路径综述
摘要:人工智能与操作系统的深度融合正在催生一场根本性的范式革命。传统操作系统正从被动的资源管理者演变为主动的意图理解者,智能体(Agent)正取代进程成为新的核心调度单元。本文系统综述了AIOS的五大核心特征(内核重塑、交互革命、端云协同、自进化能力、内生安全),深入剖析了Agent在其中作为调度原子、交互中枢、安全容器和进化触角的多重角色。在此基础上,重点分析了支撑这一演进的关键标准与协议体系,特别是对MCP、A2A、ACP和AONP四大智能体通信协议进行了深度比较研究,揭示其从"模型-工具"连接到"智能体互联网"的完整协议栈架构。最后,本文提出传统OS向AIOS演进的三阶段路线图,为未来智能操作系统的发展提供了系统化的理论框架和技术参考。
关键词:AIOS;智能体(Agent);MCP协议;A2A协议;AONP协议;端云协同;内生安全;操作系统演进
1 引言
操作系统自诞生以来,始终扮演着计算机资源管理者的角色。从批处理到分时系统,从单机到网络化,每一次演进都在追求更高的资源利用率和更好的用户体验。然而,这些演进的本质始终未变:操作系统是一个被动执行精确指令的确定性机器。用户需要将自己的意图精确翻译为机器能理解的指令序列,操作系统则忠实地分配CPU时间片、管理内存页面、调度I/O请求。
大语言模型(LLM)的出现打破了这一范式。当机器能够理解自然语言、进行逻辑推理并自主规划任务时,操作系统的核心目标从"执行指令"跃迁为"达成意图"。这一转变催生了AI操作系统(AIOS)的概念------一个以大模型为"大脑"、以智能体为"公民"、以意图驱动为灵魂的新型操作系统。
然而,AIOS的实现并非单一技术的突破,而是一项涵盖架构设计、调度机制、记忆系统、安全模型和生态标准的系统性工程。当前,业界已涌现出多种AIOS架构方案和Agent通信协议,形成了从底层架构到上层协议的完整技术栈。本文旨在系统梳理这一领域的研究进展,厘清核心概念,比较关键技术路线,并展望未来演进方向。
2 AIOS的核心架构与关键特征
2.1 从进程到Agent:内核的重塑
传统操作系统内核的核心职责是管理进程和线程------它们是被动的执行单元,由外部事件或调度器触发,执行确定的代码路径。AIOS则将这一模型彻底颠覆:Agent成为新的"一等公民"。
Agent是具备自主性、反应性、社会性和主动性的智能执行单元。它不仅能执行代码,更能理解意图、拆解任务、调用工具并在多Agent间协作。AIOS内核因此进化为"意图驱动的调度中枢",管理的资源也从CPU时间片和内存页扩展至LLM推理槽位、上下文窗口配额和工具调用权限。实验表明,基于此架构的调度器可在多Agent并发场景下实现最高2.1倍的执行加速[1]。
2.2 AIOS的五大核心特征
综合当前业界研究与实践,成熟的AIOS普遍具备以下五大核心特征:
特征一:内核重塑------从资源管理到智能体调度。 传统OS管理CPU/内存等硬件资源,AIOS则将LLM作为系统"大脑",将Agent提升为调度核心。内核需同时管理GPU、NPU等异构算力,并实现基于意图优先级的动态调度。典型案例包括中科创达滴水AIOS 2.1的AquaClaw架构[2]。
特征二:交互革命------从GUI到多模态意图界面。 交互范式从被动的"点击-响应"升级为主动的多模态自然交互,系统能理解语音、手势、表情并预判用户需求。荣耀MagicOS 10等系统已展现出这一能力[3]。
特征三:端云协同------从单一计算到混合智能。 AIOS根据任务延迟、隐私等级和算力需求,动态决策在端侧还是云端执行推理,实现无缝的混合计算。滴水AIOS支持14B大模型的端侧部署即为典型代表[2]。
特征四:自进化能力------从固化功能到活的系统。 通过持续学习用户反馈,系统能自我迭代优化。荣耀MagicOS 10的场景理解能力在3个月内可从200个场景自进化至3000个,实现15倍增长[3]。
特征五:内生安全------从被动防御到主动免疫。 安全模型从外挂防护转向系统内置的"免疫系统",包括LLM输出预检、Agent沙箱隔离、能力令牌和内存安全语言(如Rust)的应用[4]。
3 Agent在AIOS中的角色与作用
3.1 作为调度原子的Agent
在AIOS架构中,Agent是调度器眼中最小的可管理单元。每个Agent携带着优先级、依赖图、所需LLM推理资源(算力、上下文窗口、工具权限)等元信息,在内核的Agent调度队列中被排序和分配。这种调度抽象使得OS从面向"计算时间"转向面向"目标达成"------调度器不再问"下一个时间片给谁?",而是问"哪个Agent的意图最紧急、依赖已满足、且有推理槽位可用?"。
3.2 作为交互中枢的Agent
在语言用户界面(LUI)成为主流的趋势下,Agent是交互闭环中的行动中枢。当LUI接收到一个复杂请求后,系统会创建一个对应的Agent,由它负责理解、拆解、调用具体服务,最终将结果以自然语言和多模态形式返回给用户。这种能力使Agent能够同时访问日历API、邮件API、数据库甚至IoT设备接口,将所有原子动作编织成一个流畅的任务流。
3.3 作为安全容器的Agent
AIOS的安全模型要求每个Agent都成为一个"带权限令牌的移动沙箱",运行在隔离环境中。Agent的任何行为都不是"免检"的------当它试图访问敏感资源时,会触发六阶段安全管道(决策→选择→验证→审批→执行→审计)[5]。调度器和内核预检机制(如ProbeLogits[6])会实时审查Agent行为的合法性。
3.4 作为进化触角的Agent
Agent是系统与真实世界交互、获取反馈的神经末梢。它使用OS提供的标准化记忆服务,将成功经验、用户偏好等存储为长期记忆,同时向云端反馈高质量行为数据参与全局模型的强化学习,形成正反馈学习闭环。
4 关键标准与协议体系
AI与OS的深度融合有赖于由标准、规范与协议构成的坚实基座。当前业界已形成覆盖"模型-工具"、"Agent-Agent"和"智能体互联网"的全域协议栈。
4.1 MCP:模型的"USB-C"接口
MCP(Model Context Protocol)由Anthropic于2024年11月推出,2025年12月捐赠给Linux基金会新成立的Agentic AI Foundation(AAIF)[7]。该协议采用客户端-服务器架构,基于JSON-RPC 2.0编码,定义了三大核心原语:Tools(可执行函数)、Resources(上下文数据)和Prompts(模板化消息)。MCP的目标是为大模型提供标准化的外部工具和数据源连接方式,被业界形象地称为"AI系统的USB-C接口"。2025-11-25版规范已引入增强型OAuth 2.0授权和Streamable HTTP传输升级[8]。
4.2 A2A:Agent间的协作协议
A2A(Agent-to-Agent Protocol)由Google于2025年4月发布,2026年3月正式发布v1.0生产就绪版本,由Linux基金会托管,目前已获得150+组织支持[9]。A2A采用三层协议栈架构:底层为Protocol Buffers定义的数据模型;中层为11个核心抽象操作(如SendMessage、GetTask等);顶层支持JSON-RPC 2.0、gRPC、HTTP+JSON/REST等多种绑定。其核心原语包括Agent Cards(Agent能力描述)、Tasks(有状态工作单元)和Messages(结构化通信)。A2A已于2026年进入企业生产环境,应用案例涵盖Tyson Foods供应链自动化与ServiceNow AI Agent Fabric[9]。
4.3 ACP:联邦化通信框架
ACP(Agent Communication Protocol)由IBM Research的BeeAI平台提出,核心设计理念已并入A2A体系[10]。ACP采用分层联邦架构,包含语义层(意图映射与SLA协商)、联邦发现层(去中心化注册与DID身份验证)和传输层(RESTful HTTP与MIME多类型消息)。其突出特点是支持去中心化身份验证(基于W3C DID标准)和针对资源受限环境设计的μACP变体[10]。
4.4 AONP:智能体互联网的中国方案
AONP(Agent Open Network Protocol)由中国移动主导提出,是一套面向"智能体互联网(IoA)"的"五横一纵"协议簇[11]。其中"五横"包括:SRMP(语义路由与组播通信协议)、M2TP(多模态传输协议)、AIDP(智能体与工具跨域发现协议)、SMIP(会话管理与调用协议)和A2P(智能体授权访问协议);"一纵"指智能体网关AGW。AONP的独特价值在于其网络级视野和运营商基因,首次将算网资源调度、跨域寻址路由等基础网络能力纳入Agent协议设计,并已启动IETF、3GPP等国际标准布局[11]。
4.5 四强协议对比
| 特征 | MCP | A2A | ACP | AONP |
|---|---|---|---|---|
| 核心发起方 | Anthropic | IBM/BeeAI | 中国移动 | |
| 核心视角 | 模型开发者 | 企业应用集成商 | 去中心化网络构建者 | 网络运营商 |
| 主要目标 | 模型连接标准化工具和数据 | 不同系统间Agent协作 | 通用Agent通信 | 大规模、跨域智能体互联网 |
| 架构风格 | 客户端-服务器(C/S) | 混合(企业级集中式) | 分层联邦 | 分层协议栈(强调网络能力) |
| 核心能力 | 工具调用、资源暴露 | 任务管理、Agent发现 | 意图映射、联邦发现 | 广域互联、路由、算网协同 |
| 安全模型 | 应用层OAuth 2.0 | 企业级认证(API Key/mTLS) | DID+proof-of-intent | 网络层+应用层+网关 |
| 标准化路径 | Linux基金会AAIF | Linux基金会 | 已并入A2A | IETF, 3GPP, ITU-T |
| 生态成熟度 | 最高(97M+生态) | 高(150+组织) | 萌芽(已合并) | 快速发展中 |
四大协议并非竞争替代,而是分层互补:MCP解决"模型如何连接工具"的问题,A2A解决"Agent之间如何协作"的问题,ACP提供"边缘弱网通信"的补充能力,AONP则从网络层面构建"智能体互联网"的基础设施。四者共同构成了一个覆盖工具连接→Agent协作→联邦编排→网络级互联的完整协议栈。
5 安全与治理标准体系
除通信协议外,AIOS的安全可信还需依赖多层次治理标准。ISO/IEC 42001是首个AI管理体系(AIMS)国际标准,可与企业现有ISO 27001信息安全体系无缝集成[12]。NIST AI RMF 1.0提供了完整的AI风险管理框架[13]。在技术实操层面,OWASP Top 10 for LLM & Agent已成为开发者直接依赖的安全清单[14]。
国内方面,中国在"全国一体化算力网"建设指引下,正推动《人工智能 端云设备间模型协同系统规范》等国家标准制定[15],GB/T 45401.2-2025确立了包含云边端的三层分布式计算架构[16]。
6 传统OS向AIOS的演进路径
基于当前技术成熟度和产业实践,传统操作系统向AIOS的演进可分为三个递进阶段:
阶段一:AI on OS(AI赋能期,2025年前)。在不改动系统内核的前提下,以应用形式部署AI能力。典型实践包括Windows Copilot、ONNX Runtime端侧推理。AI与OS完全隔离,无法感知系统状态,能力孤立。
阶段二:AI in OS(AI融合期,2025-2030年)。将AI能力深度集成到系统内核与服务层。核心改造包括:在内核旁构建AI调度子系统、内置向量数据库和图数据库作为记忆服务、增加LLM系统调用接口、实施六阶段安全管道。标志性产物是Agent运行时环境。当前Windows Server 2025通过Azure Arc实现的混合云集成、热补丁(Hotpatch)无需重启的更新能力,均属于此阶段的早期实践。
阶段三:AI as OS(AI原生期,2030年以后)。从零设计以Agent为原生执行单元、以LLM为调度核心的全新操作系统。传统内核退化为硬件抽象层(HAL),一切皆Agent。vivo蓝河操作系统采用Rust重写内核即为这一方向的先导探索[4]。
| 演进阶段 | Agent角色 | 内核改造 | 调度对象 | 安全模型 | 典型代表 |
|---|---|---|---|---|---|
| AI on OS | 应用层插件 | 无 | 无Agent调度 | 应用自身安全 | Windows Copilot |
| AI in OS | 系统级调度原子 | 新增AI子系统 | Agent+进程并行 | 六阶段管道+沙箱 | Azure Arc+Hotpatch |
| AI as OS | 唯一执行单元 | AI内核本身 | 纯Agent | 语言级安全(Rust) | vivo蓝河内核 |
7 结论与展望
AIOS的出现标志着计算机系统从"精确计算"到"智能服务"的历史性转折。Agent作为新的核心调度单元,正在重新定义操作系统的架构、交互、安全和进化能力。MCP、A2A、ACP和AONP四大协议从不同视角出发,共同构建了Agent通信的标准化栈,为"智能体互联网"奠定了技术基座。
展望未来五年,AI与OS的深度融合将沿着三条主线展开:其一,协议栈持续完善,MCP、A2A、AONP等协议将在互操作性上持续增强,形成多协议共存的生态格局;其二,Agent运行时成为OS标准组件,系统将内置Agent SDK、记忆服务和意图引擎;其三,安全治理体系同步成熟,从代码级(Rust语言)到架构级(Agent沙箱)再到治理级(ISO 42001)的多层防御体系全面建立。
在这场变革中,中国正通过AONP等提案积极参与国际标准制定,推动算力网络与人工智能深度融合的"中国方案"成为全球共识。这场演进正在从根本上重新定义"计算"的意义------从执行指令到理解意图,从管理资源到成就目标。
参考文献
1\] Rutgers University. AIOS: A Modular, Extensible and Efficient Architecture for LLM as an Operating System Service. 2025. \[2\] 中科创达. 滴水AIOS 2.1技术白皮书. 2025. \[3\] 荣耀. MagicOS 10技术架构白皮书. 2025. \[4\] vivo. 蓝河操作系统技术白皮书. 2025. \[5\] Linux Foundation. Agentic AI Foundation: Security Guidelines for Agent Systems. 2026. \[6\] ProbeLogits: Kernel-Level Pre-Interception for LLM Safety. arXiv, 2025. \[7\] Linux Foundation Agentic AI Foundation. Model Context Protocol Specification v2025-11-25. 2025. \[8\] Anthropic. MCP Authorization Server Discovery Enhancement. 2025. \[9\] Google. Agent-to-Agent Protocol v1.0 Specification. 2026. \[10\] IBM Research. BeeAI Platform and Agent Communication Protocol. 2025. \[11\] 中国移动. 智能体互联网开放网络协议(AONP)技术白皮书. 2025. \[12\] ISO/IEC. ISO/IEC 42001:2023 Information technology --- Artificial intelligence --- Management system. 2023. \[13\] NIST. Artificial Intelligence Risk Management Framework (AI RMF 1.0). 2023. \[14\] OWASP. OWASP Top 10 for LLM Applications \& Agentic AI. 2025. \[15\] 全国信息技术标准化技术委员会. 人工智能 端云设备间模型协同系统规范(征求意见稿). 2025. \[16\] GB/T 45401.2-2025. 人工智能 服务平台 第2部分:分布式计算框架. 2025.