2025云栖大会举行:阿里云旗舰模型Qwen3-Max、下一代架构Qwen3-Next重磅发布,加速构建“云智一体”AI超级计算机

目录

大模型创新与架构突破

Agent开发与平台升级

AI基础设施与算力突破总结


9月24日,为期三天的2025云栖大会在杭州云栖小镇开幕。大会以"云智一体·碳硅共生"为主题,重点聚焦AI全产业链的发展趋势、技术创新和最新应用。作为全球云计算和人工智能产业链的年度盛会,阿里云在大会现场发布了多项重磅技术更新及产品,全面展示其在大模型、云计算和AI等领域的最新探索与实践,旨在加速构建下一代AI超级计算机。

大模型创新与架构突破

活动当天,阿里通义旗舰模型Qwen3-Max全新亮相,预训练数据量达36T tokens,总参数超过万亿,在Coding编程能力和Agent工具调用能力上实现突破。其Instruct版本在SWE-Bench Verified测试中斩获69.6分。同时,下一代基础模型架构Qwen3-Next及系列模型也发布,该模型总参数80B仅激活3B,性能即可媲美千问3旗舰版235B模型,实现了模型计算效率的重大突破。Qwen3-Next采用混合注意力机制、高稀疏度MoE结构、多token预测(MTP)机制等核心技术,模型训练成本较密集模型大降超90%,长文本推理吞吐量提升10倍以上,为未来大模型的训练和推理效率设立了新标准。

活动当天,阿里通义旗舰模型Qwen3-Max全新亮相,总参数超过万亿,拥有Coding编程能力和Agent工具调用能力,其Instruct版本在SWE-Bench Verified测试中斩获69.6分。同时发布的下一代基础模型架构Qwen3-Next及系列模型,模型总参数80B仅激活3B,性能即可媲美千问3旗舰版235B模型,实现了模型计算效率的重大突破。Qwen3-Next针对大模型的持续扩展趋势而设计,创新采用了混合注意力机制、高稀疏度MoE结构、多token预测(MTP)机制等核心技术,使模型训练成本较密集模型Qwen3-32B大降超90%,长文本推理吞吐量提升10倍以上,为未来大模型的训练和推理效率设立了新标准。

Agent开发与平台升级

一站式模型服务和Agent开发平台阿里云百炼在大会上进行了重磅升级。阿里云发布全新Agent开发框架ModelStudio-ADK,该框架突破了预定义编排方式的局限,可帮助企业高效开发具备自主决策、多轮反思和循环执行能力的Agent。使用ModelStudio-ADK,1个小时就能轻松开发一个能生成深度报告的Deep Research项目。得益于模型能力的不断提升和Agent应用的普及,过去一年,阿里云百炼平台的模型日均调用量增长了15倍。

在2025杭州云栖大会上,一站式模型服务和Agent开发平台阿里云百炼重磅升级,发布全新Agent开发框架ModelStudio-ADK。该框架突破了预定义编排方式开发Agent的局限,可帮助企业高效开发具备自主决策、多轮反思和循环执行能力的Agent。使用ModelStudio-ADK,1个小时就能轻松开发一个能生成深度报告的Deep Research项目。随着模型能力的不断提升以及Agent应用的普及,过去一年,阿里云百炼平台的模型日均调用量增长了15倍。

AI基础设施与算力突破总结

在服务器层面,阿里云发布全新一代磐久128超节点AI服务器。这款由阿里云自主研发设计的超节点服务器具备高密度、高性能和高可用的核心优势,单柜支持128个AI计算芯片,刷新业界密度纪录。磐久超节点集成了阿里自研CIPU 2.0芯片和EIC/MOC高性能网卡,可实现高达Pb/s级别Scale-Up带宽和百ns极低延迟。相对于传统架构,同等AI算力下推理性能还可提升50%,为阿里云打造"AI超级计算机"提供了坚实的算力基础。

在服务器层面,阿里云发布全新一代磐久128超节点AI服务器。新一代磐久超节点服务器由阿里云自主研发设计,具备高密度、高性能和高可用的核心优势,可高效支持多种AI芯片,单柜支持128个AI计算芯片,密度刷新业界纪录。磐久超节点集成阿里自研CIPU 2.0芯片和EIC/MOC高性能网卡,采用开放架构,扩展能力极强,可实现高达Pb/s级别Scale-Up带宽和百ns极低延迟,同等AI算力下推理性能还可提升50%。这为阿里云打造"AI超级计算机"提供了坚实的基础。

相关推荐
eyuiomvtywn3 分钟前
阿里云DNS解析Vercel部署项目的域名
运维·服务器·阿里云
Jay200211118 分钟前
【机器学习】10 正则化 - 减小过拟合
人工智能·机器学习
sxwuyanzu18 分钟前
企业知识库的隐形危机:从“文档堆“到“知识系统“的进化之路
人工智能
5***790029 分钟前
人工智能在环保监测中的数据分析
人工智能
算家计算39 分钟前
芯片战打响!谷歌TPU挑战英伟达:AI算力战争背后的行业变局
人工智能·nvidia·芯片
顾林海1 小时前
从0到1搭建Android网络框架:别再让你的请求在"路上迷路"了
android·面试·架构
语落心生1 小时前
Apache Geaflow推理框架Geaflow-infer 解析系列(四)依赖管理
架构
技术支持者python,php1 小时前
训练模型,物体识别(opencv)
人工智能·opencv·计算机视觉
爱笑的眼睛111 小时前
深入理解MongoDB PyMongo API:从基础到高级实战
java·人工智能·python·ai
云渠道商yunshuguoji1 小时前
亚马逊云渠道商:如何用 EC2 Auto Scaling 轻松应对流量洪峰?
架构