2025云栖大会举行:阿里云旗舰模型Qwen3-Max、下一代架构Qwen3-Next重磅发布,加速构建“云智一体”AI超级计算机

目录

大模型创新与架构突破

Agent开发与平台升级

AI基础设施与算力突破总结


9月24日,为期三天的2025云栖大会在杭州云栖小镇开幕。大会以"云智一体·碳硅共生"为主题,重点聚焦AI全产业链的发展趋势、技术创新和最新应用。作为全球云计算和人工智能产业链的年度盛会,阿里云在大会现场发布了多项重磅技术更新及产品,全面展示其在大模型、云计算和AI等领域的最新探索与实践,旨在加速构建下一代AI超级计算机。

大模型创新与架构突破

活动当天,阿里通义旗舰模型Qwen3-Max全新亮相,预训练数据量达36T tokens,总参数超过万亿,在Coding编程能力和Agent工具调用能力上实现突破。其Instruct版本在SWE-Bench Verified测试中斩获69.6分。同时,下一代基础模型架构Qwen3-Next及系列模型也发布,该模型总参数80B仅激活3B,性能即可媲美千问3旗舰版235B模型,实现了模型计算效率的重大突破。Qwen3-Next采用混合注意力机制、高稀疏度MoE结构、多token预测(MTP)机制等核心技术,模型训练成本较密集模型大降超90%,长文本推理吞吐量提升10倍以上,为未来大模型的训练和推理效率设立了新标准。

活动当天,阿里通义旗舰模型Qwen3-Max全新亮相,总参数超过万亿,拥有Coding编程能力和Agent工具调用能力,其Instruct版本在SWE-Bench Verified测试中斩获69.6分。同时发布的下一代基础模型架构Qwen3-Next及系列模型,模型总参数80B仅激活3B,性能即可媲美千问3旗舰版235B模型,实现了模型计算效率的重大突破。Qwen3-Next针对大模型的持续扩展趋势而设计,创新采用了混合注意力机制、高稀疏度MoE结构、多token预测(MTP)机制等核心技术,使模型训练成本较密集模型Qwen3-32B大降超90%,长文本推理吞吐量提升10倍以上,为未来大模型的训练和推理效率设立了新标准。

Agent开发与平台升级

一站式模型服务和Agent开发平台阿里云百炼在大会上进行了重磅升级。阿里云发布全新Agent开发框架ModelStudio-ADK,该框架突破了预定义编排方式的局限,可帮助企业高效开发具备自主决策、多轮反思和循环执行能力的Agent。使用ModelStudio-ADK,1个小时就能轻松开发一个能生成深度报告的Deep Research项目。得益于模型能力的不断提升和Agent应用的普及,过去一年,阿里云百炼平台的模型日均调用量增长了15倍。

在2025杭州云栖大会上,一站式模型服务和Agent开发平台阿里云百炼重磅升级,发布全新Agent开发框架ModelStudio-ADK。该框架突破了预定义编排方式开发Agent的局限,可帮助企业高效开发具备自主决策、多轮反思和循环执行能力的Agent。使用ModelStudio-ADK,1个小时就能轻松开发一个能生成深度报告的Deep Research项目。随着模型能力的不断提升以及Agent应用的普及,过去一年,阿里云百炼平台的模型日均调用量增长了15倍。

AI基础设施与算力突破总结

在服务器层面,阿里云发布全新一代磐久128超节点AI服务器。这款由阿里云自主研发设计的超节点服务器具备高密度、高性能和高可用的核心优势,单柜支持128个AI计算芯片,刷新业界密度纪录。磐久超节点集成了阿里自研CIPU 2.0芯片和EIC/MOC高性能网卡,可实现高达Pb/s级别Scale-Up带宽和百ns极低延迟。相对于传统架构,同等AI算力下推理性能还可提升50%,为阿里云打造"AI超级计算机"提供了坚实的算力基础。

在服务器层面,阿里云发布全新一代磐久128超节点AI服务器。新一代磐久超节点服务器由阿里云自主研发设计,具备高密度、高性能和高可用的核心优势,可高效支持多种AI芯片,单柜支持128个AI计算芯片,密度刷新业界纪录。磐久超节点集成阿里自研CIPU 2.0芯片和EIC/MOC高性能网卡,采用开放架构,扩展能力极强,可实现高达Pb/s级别Scale-Up带宽和百ns极低延迟,同等AI算力下推理性能还可提升50%。这为阿里云打造"AI超级计算机"提供了坚实的基础。

相关推荐
过河卒_zh15667665 分钟前
网信发布2025年“人工智能+政务”规范应用案例拟入选名单公示
人工智能·大模型·aigc·政务·算法备案
540_5405 分钟前
ADVANCE Day26
人工智能·python·机器学习
IT_陈寒8 分钟前
Redis 性能优化实战:5个被低估的配置项让我节省了40%内存成本
前端·人工智能·后端
乾元9 分钟前
用 AI 做联动:当应用层出现问题,网络如何被“自动拉入决策回路”
运维·开发语言·网络·人工智能·ci/cd·自动化
qq_124987075313 分钟前
基于springboot的智能医院挂号系统(源码+论文+部署+安装)
java·人工智能·spring boot·后端·毕业设计
wenxiaohai12317 分钟前
在anaconda中安装cuda-pytorch
人工智能·pytorch·python·anaconda
IT·陈寒18 分钟前
零配置、开箱即用:seekdb 如何成为 AI 时代的“全能嵌入式数据库”? ——基于 OceanBase seekdb 的实践体验与 AI 开发思考
数据库·人工智能·oceanbase
建投数据21 分钟前
建投数据再度获评国家级“高新技术企业”
大数据·人工智能
中电金信24 分钟前
中电金信助力200+金融机构同步迁移SWIFT ISO20022标准
大数据·人工智能
山土成旧客24 分钟前
【Python学习打卡-Day25】从程序崩溃到优雅处理:掌握Python的异常处理艺术
人工智能·python·学习