2025云栖大会举行:阿里云旗舰模型Qwen3-Max、下一代架构Qwen3-Next重磅发布,加速构建“云智一体”AI超级计算机

目录

大模型创新与架构突破

Agent开发与平台升级

AI基础设施与算力突破总结


9月24日,为期三天的2025云栖大会在杭州云栖小镇开幕。大会以"云智一体·碳硅共生"为主题,重点聚焦AI全产业链的发展趋势、技术创新和最新应用。作为全球云计算和人工智能产业链的年度盛会,阿里云在大会现场发布了多项重磅技术更新及产品,全面展示其在大模型、云计算和AI等领域的最新探索与实践,旨在加速构建下一代AI超级计算机。

大模型创新与架构突破

活动当天,阿里通义旗舰模型Qwen3-Max全新亮相,预训练数据量达36T tokens,总参数超过万亿,在Coding编程能力和Agent工具调用能力上实现突破。其Instruct版本在SWE-Bench Verified测试中斩获69.6分。同时,下一代基础模型架构Qwen3-Next及系列模型也发布,该模型总参数80B仅激活3B,性能即可媲美千问3旗舰版235B模型,实现了模型计算效率的重大突破。Qwen3-Next采用混合注意力机制、高稀疏度MoE结构、多token预测(MTP)机制等核心技术,模型训练成本较密集模型大降超90%,长文本推理吞吐量提升10倍以上,为未来大模型的训练和推理效率设立了新标准。

活动当天,阿里通义旗舰模型Qwen3-Max全新亮相,总参数超过万亿,拥有Coding编程能力和Agent工具调用能力,其Instruct版本在SWE-Bench Verified测试中斩获69.6分。同时发布的下一代基础模型架构Qwen3-Next及系列模型,模型总参数80B仅激活3B,性能即可媲美千问3旗舰版235B模型,实现了模型计算效率的重大突破。Qwen3-Next针对大模型的持续扩展趋势而设计,创新采用了混合注意力机制、高稀疏度MoE结构、多token预测(MTP)机制等核心技术,使模型训练成本较密集模型Qwen3-32B大降超90%,长文本推理吞吐量提升10倍以上,为未来大模型的训练和推理效率设立了新标准。

Agent开发与平台升级

一站式模型服务和Agent开发平台阿里云百炼在大会上进行了重磅升级。阿里云发布全新Agent开发框架ModelStudio-ADK,该框架突破了预定义编排方式的局限,可帮助企业高效开发具备自主决策、多轮反思和循环执行能力的Agent。使用ModelStudio-ADK,1个小时就能轻松开发一个能生成深度报告的Deep Research项目。得益于模型能力的不断提升和Agent应用的普及,过去一年,阿里云百炼平台的模型日均调用量增长了15倍。

在2025杭州云栖大会上,一站式模型服务和Agent开发平台阿里云百炼重磅升级,发布全新Agent开发框架ModelStudio-ADK。该框架突破了预定义编排方式开发Agent的局限,可帮助企业高效开发具备自主决策、多轮反思和循环执行能力的Agent。使用ModelStudio-ADK,1个小时就能轻松开发一个能生成深度报告的Deep Research项目。随着模型能力的不断提升以及Agent应用的普及,过去一年,阿里云百炼平台的模型日均调用量增长了15倍。

AI基础设施与算力突破总结

在服务器层面,阿里云发布全新一代磐久128超节点AI服务器。这款由阿里云自主研发设计的超节点服务器具备高密度、高性能和高可用的核心优势,单柜支持128个AI计算芯片,刷新业界密度纪录。磐久超节点集成了阿里自研CIPU 2.0芯片和EIC/MOC高性能网卡,可实现高达Pb/s级别Scale-Up带宽和百ns极低延迟。相对于传统架构,同等AI算力下推理性能还可提升50%,为阿里云打造"AI超级计算机"提供了坚实的算力基础。

在服务器层面,阿里云发布全新一代磐久128超节点AI服务器。新一代磐久超节点服务器由阿里云自主研发设计,具备高密度、高性能和高可用的核心优势,可高效支持多种AI芯片,单柜支持128个AI计算芯片,密度刷新业界纪录。磐久超节点集成阿里自研CIPU 2.0芯片和EIC/MOC高性能网卡,采用开放架构,扩展能力极强,可实现高达Pb/s级别Scale-Up带宽和百ns极低延迟,同等AI算力下推理性能还可提升50%。这为阿里云打造"AI超级计算机"提供了坚实的基础。

相关推荐
华为云开发者联盟6 小时前
【新特性】 版本速递 | 华为云Versatile智能体平台 新增特性介绍(2025年10月发布)
人工智能·华为云开发者联盟·ai agent·mcp·华为云versatile
leaf9z6 小时前
阿里云ECS在线扩容磁盘
阿里云·云计算·shell
Francek Chen6 小时前
【自然语言处理】预训练02:近似训练
人工智能·pytorch·深度学习·自然语言处理
云和数据.ChenGuang7 小时前
tensorflow的广播机制
人工智能·python·tensorflow
J_Xiong01177 小时前
【VLNs篇】11:Dynam3D: 动态分层3D令牌赋能视觉语言导航中的VLM
人工智能·算法·3d
极客BIM工作室7 小时前
AI 图像生成技术发展时间脉络:从 GAN 到多模态大模型的知名模型概略解析
人工智能·神经网络·生成对抗网络
观望过往7 小时前
Kafka 全方位详细介绍:从架构原理到实践优化
分布式·架构·kafka