从单体大模型到Agent网络:当AI互联网取代信息互联网,底层架构需要怎么变?

本文从技术架构角度分析AI系统从Scaling Up向Scaling Out演进的工程路径,重点讨论MOA与MoE的本质差异、Agent间通信协议设计思路、以及白盒可审计架构的工程实现。

互联网底层资源模型的切换

传统互联网的运行逻辑建立在一个隐含假设上:网络连接的核心资源是人的注意力。搜索引擎聚合网页、推荐算法分配内容、社交平台经营关系链,所有商业模式归根结底都在竞争人类每天十几个小时的清醒时间。用户在线时他们的判断力被接入网络,离开屏幕这些能力就下线了。

Agent的规模化部署正在改变这个假设。一个Agent可以7×24小时运行,一个用户可以同时管理数十个Agent执行不同任务,计算脱离了人的在场而持续发生。网络中的稀缺资源正在发生根本切换------从有限的人类注意力变成可持续扩展的Agent算力。这个变化可以定义为从信息互联网到AI互联网的范式跳跃。

与此同时,信息可信度的系统性坍塌在加速这个转变。AI低成本批量制造的合成内容让旧互联网的信息聚合模式逐渐失效,搜索结果真假难辨。新一代AI互联网的核心价值转向Agent之间可验证、可追溯的协作------每一步处理的来源可查、逻辑可审、结论可复现。

Scaling Up路线的结构性约束

中心化的权力结构风险

模型规模大到只有少数机构能训练和部署时,全球AI能力供给就集中在极少数节点上。分布式系统领域几十年的工程实践反复证明,过度中心化的基础设施最终都会在可用性、安全性和治理层面暴露结构性缺陷。

黑盒推理的不可审计性

千亿参数Transformer内部的推理过程目前没有可靠方法完整解释。对于医疗诊断、金融风控、法律推理这些有硬性合规要求的场景,黑盒不可审计是准入层面的阻断性障碍。

资源效率的边际递减

Chinchilla scaling law的研究表明数据量和参数量之间存在最优配比关系,一味堆叠参数不能持续带来等比例的能力增长。从投入产出比看,这条曲线终将遇到经济上不可持续的拐点。

以上分析并非否定大模型的价值,大模型仍然是AI能力的重要来源。值得质疑的是"唯一正确路线"这个假设本身。

Scaling Out的工程路径

分布式系统的核心理念在软件工程领域已经验证了几十年:微服务替代单体、Kubernetes替代巨型物理机、MapReduce替代单机计算。共同哲学是多个专精单元通过协议协作,替代一个试图什么都做的庞然大物。AI系统正在经历类似的架构演进。

Scaling Out在AI场景下的含义是让多个Agent通过网络连接协作完成复杂任务,每个Agent使用最适合自己任务的模型,通过标准化通信协议协同工作。这种架构模式被称为MOA(Mixture of Agents)。

MOA vs MoE:两种本质不同的混合架构

维度 MoE(Mixture of Experts) MOA(Mixture of Agents)
作用范围 单一模型内部 多个独立Agent之间
路由机制 可学习的Gate Network自动分发 显式任务编排与协议协商
可观测性 黑盒,Gate选择路径不可解释 白盒,每个Agent输入输出完整可记录
部署形态 同一进程内的参数分片 独立进程/容器,可跨网络部署
容错能力 Expert故障即模型故障 单Agent故障可降级处理
可审计性 整体输出可审计,内部不可审计 每一步协作链条完整可审计

MoE本质上是模型内部的计算效率优化------通过稀疏激活让模型推理时只使用部分参数,在不等比增加计算量的前提下扩大总容量。它解决的是如何让单一大模型更高效的问题。

MOA解决的问题完全不同:如何让多个独立AI系统协作完成超出任何单一系统能力范围的任务。每个Agent是独立可观测的处理单元,拥有自己的接口、状态管理和错误处理逻辑,协作关系显式定义,协作过程每步可记录回放。两者不矛盾------MOA中的某个Agent内部完全可以用MoE模型------但它们回答的问题不在同一层面。

Agent间通信协议的设计考量

消息传递层

Agent间通信可以参考成熟的消息队列模式,但AI场景有特殊需求:消息是非结构化自然语言与结构化数据的混合体,上下文窗口有限制,响应时间方差较大。协议需要在灵活性和确定性之间平衡------过于严格的schema限制表达能力,过于松散的格式导致语义漂移。

任务编排层

复杂任务涉及多Agent的串并行协作,需要定义执行DAG、处理依赖关系、超时控制和降级方案。与传统工作流不同的是,AI Agent响应具有非确定性,编排层需要具备质量评估和动态路由能力。

状态与上下文管理

Agent协作中的上下文传递是核心工程挑战。上下文窗口有限,长链条协作需要解决信息压缩传递、避免传递损耗、在Agent间共享状态而不引入过度耦合等问题。

白盒可审计的工程实现

MOA的白盒可审计优势需要具体工程手段保障。

全链路Trace: 借鉴OpenTelemetry思路,为每个任务生成唯一Trace ID,Agent间每次调用都携带ID并记录span------调用时间、输入输出摘要、Token消耗、模型版本。任何最终输出都可反向追溯完整处理链条。

Agent级输入输出日志: 每次执行完整记录输入(system prompt、user message、工具调用结果)和输出(推理结果、工具请求、最终回复),作为审计和调试的基础数据,在合规场景中可作为决策依据的法律凭证。

可复现性设计: 通过固定种子、记录模型版本和推理参数、保存上下文快照,使同一任务可被重新执行并得到一致结果。temperature=0配合版本锁定可最大限度保障可复现性。

人工干预接口: 关键决策节点设置Human-in-the-Loop断点,系统暂停并呈现上下文和建议操作给人类审核,通过后才继续执行,确保人类保持最终控制权。

AI for Science:Internet of Agents的前沿方向

Agent协作网络成熟后,一个值得关注的方向是AI for Science。不同领域的专精Agent组成虚拟研究团队------文献检索Agent做系统性综述,实验设计Agent提出假设,数据分析Agent识别统计显著性模式。每个Agent在专业领域做到极致,通过协作完成单一Agent无法独立完成的跨学科研究。

这意味着AI研究本身有可能被平权化。各行业从业者通过组合开源Agent构建自己领域的研究系统,材料科学家、生物学家、气候学家都可能成为AI工具的构建者而非仅仅是使用者。Internet of Agents有潜力将AI能力从集中供给转变为分布式自组织生态。

两种范式的共存

Scaling Up和Scaling Out是在不同场景下各有优势的互补方案。大模型在需要极致通用理解和少样本泛化的场景中不可替代,MOA在需要可审计、可控制、可组合的复杂任务执行场景中具有结构性优势。从工程角度看,未来几年Agent网络基础设施层的建设------通信协议标准化、编排引擎成熟化、可审计框架产品化------将是行业关键领域。

各位在实际项目中有没有尝试过多Agent协作的架构?MOA vs 单一大模型方案,你们在什么场景下倾向于哪种?

相关推荐
zhangxingchao1 小时前
AI Agent 基础问题系统整理:从 LangChain、LangGraph、MCP 到 Agent 架构、记忆、工具调用与评估体系
前端·人工智能·后端
chloe23332 小时前
使用colab完成机器学习记录
人工智能·机器学习
浑手营销2 小时前
浑手科技案例分享:133个精准询盘短视频玩法
前端·人工智能·科技
IT_陈寒2 小时前
SpringBoot自动配置的坑,差点让我加班到天亮
前端·人工智能·后端
俊哥V2 小时前
每日 AI 研究简报 · 2026-05-18
人工智能·ai
lwf0061642 小时前
【AI工具推荐】OpenSpec:让 AI 编程从“碰运气“变成“可预测“
人工智能
Wanderer X2 小时前
【LLM】code agent bench
人工智能
互联科技报2 小时前
2026年幻视AI数字工牌与全域零售AI解决方案官方指南
人工智能·零售
悟乙己2 小时前
构建金融级 AI Agent:Claude for Financial Services 架构解析
人工智能·金融·架构