2025云栖大会举行:阿里云旗舰模型Qwen3-Max、下一代架构Qwen3-Next重磅发布,加速构建“云智一体”AI超级计算机

目录

大模型创新与架构突破

Agent开发与平台升级

AI基础设施与算力突破总结


9月24日,为期三天的2025云栖大会在杭州云栖小镇开幕。大会以"云智一体·碳硅共生"为主题,重点聚焦AI全产业链的发展趋势、技术创新和最新应用。作为全球云计算和人工智能产业链的年度盛会,阿里云在大会现场发布了多项重磅技术更新及产品,全面展示其在大模型、云计算和AI等领域的最新探索与实践,旨在加速构建下一代AI超级计算机。

大模型创新与架构突破

活动当天,阿里通义旗舰模型Qwen3-Max全新亮相,预训练数据量达36T tokens,总参数超过万亿,在Coding编程能力和Agent工具调用能力上实现突破。其Instruct版本在SWE-Bench Verified测试中斩获69.6分。同时,下一代基础模型架构Qwen3-Next及系列模型也发布,该模型总参数80B仅激活3B,性能即可媲美千问3旗舰版235B模型,实现了模型计算效率的重大突破。Qwen3-Next采用混合注意力机制、高稀疏度MoE结构、多token预测(MTP)机制等核心技术,模型训练成本较密集模型大降超90%,长文本推理吞吐量提升10倍以上,为未来大模型的训练和推理效率设立了新标准。

活动当天,阿里通义旗舰模型Qwen3-Max全新亮相,总参数超过万亿,拥有Coding编程能力和Agent工具调用能力,其Instruct版本在SWE-Bench Verified测试中斩获69.6分。同时发布的下一代基础模型架构Qwen3-Next及系列模型,模型总参数80B仅激活3B,性能即可媲美千问3旗舰版235B模型,实现了模型计算效率的重大突破。Qwen3-Next针对大模型的持续扩展趋势而设计,创新采用了混合注意力机制、高稀疏度MoE结构、多token预测(MTP)机制等核心技术,使模型训练成本较密集模型Qwen3-32B大降超90%,长文本推理吞吐量提升10倍以上,为未来大模型的训练和推理效率设立了新标准。

Agent开发与平台升级

一站式模型服务和Agent开发平台阿里云百炼在大会上进行了重磅升级。阿里云发布全新Agent开发框架ModelStudio-ADK,该框架突破了预定义编排方式的局限,可帮助企业高效开发具备自主决策、多轮反思和循环执行能力的Agent。使用ModelStudio-ADK,1个小时就能轻松开发一个能生成深度报告的Deep Research项目。得益于模型能力的不断提升和Agent应用的普及,过去一年,阿里云百炼平台的模型日均调用量增长了15倍。

在2025杭州云栖大会上,一站式模型服务和Agent开发平台阿里云百炼重磅升级,发布全新Agent开发框架ModelStudio-ADK。该框架突破了预定义编排方式开发Agent的局限,可帮助企业高效开发具备自主决策、多轮反思和循环执行能力的Agent。使用ModelStudio-ADK,1个小时就能轻松开发一个能生成深度报告的Deep Research项目。随着模型能力的不断提升以及Agent应用的普及,过去一年,阿里云百炼平台的模型日均调用量增长了15倍。

AI基础设施与算力突破总结

在服务器层面,阿里云发布全新一代磐久128超节点AI服务器。这款由阿里云自主研发设计的超节点服务器具备高密度、高性能和高可用的核心优势,单柜支持128个AI计算芯片,刷新业界密度纪录。磐久超节点集成了阿里自研CIPU 2.0芯片和EIC/MOC高性能网卡,可实现高达Pb/s级别Scale-Up带宽和百ns极低延迟。相对于传统架构,同等AI算力下推理性能还可提升50%,为阿里云打造"AI超级计算机"提供了坚实的算力基础。

在服务器层面,阿里云发布全新一代磐久128超节点AI服务器。新一代磐久超节点服务器由阿里云自主研发设计,具备高密度、高性能和高可用的核心优势,可高效支持多种AI芯片,单柜支持128个AI计算芯片,密度刷新业界纪录。磐久超节点集成阿里自研CIPU 2.0芯片和EIC/MOC高性能网卡,采用开放架构,扩展能力极强,可实现高达Pb/s级别Scale-Up带宽和百ns极低延迟,同等AI算力下推理性能还可提升50%。这为阿里云打造"AI超级计算机"提供了坚实的基础。

相关推荐
Black蜡笔小新6 小时前
AI大模型训练工作站/私有化本地化AI模型训推工作站DLTM为农业生产装上AI“慧眼”
人工智能·ai大模型
小星AI6 小时前
Claude Code Agent SDK 从入门到精通,一步到位
人工智能·agent·cursor
端平入洛6 小时前
梯度是什么:PyTorch 自动求导详解
人工智能·深度学习
时序之心6 小时前
上海交大、东北大学:时序分类与感知领域的两项前沿突破
人工智能·分类·时间序列
有马贵将6 小时前
【5】微前端知识点总结
前端·架构
小五兄弟6 小时前
YouTube 肖像检测扩展背后:短剧出海版权保护的技术实现与实战策略
大数据·人工智能
阿聪谈架构6 小时前
第08章:MCP 模型上下文协议(下)
人工智能·后端
大囚长6 小时前
AI意识思想实验
人工智能
nap-joker6 小时前
不完全多模分类的推断时间动态模式选择
人工智能·分类·数据挖掘·不完整模态·插补-丢弃困境
暗夜猎手-大魔王6 小时前
转载--AI Agent 架构设计:MCP vs CLI(OpenClaw、Claude Code、Hermes Agent 对比)
人工智能