2025云栖大会举行:阿里云旗舰模型Qwen3-Max、下一代架构Qwen3-Next重磅发布,加速构建“云智一体”AI超级计算机

目录

大模型创新与架构突破

Agent开发与平台升级

AI基础设施与算力突破总结


9月24日,为期三天的2025云栖大会在杭州云栖小镇开幕。大会以"云智一体·碳硅共生"为主题,重点聚焦AI全产业链的发展趋势、技术创新和最新应用。作为全球云计算和人工智能产业链的年度盛会,阿里云在大会现场发布了多项重磅技术更新及产品,全面展示其在大模型、云计算和AI等领域的最新探索与实践,旨在加速构建下一代AI超级计算机。

大模型创新与架构突破

活动当天,阿里通义旗舰模型Qwen3-Max全新亮相,预训练数据量达36T tokens,总参数超过万亿,在Coding编程能力和Agent工具调用能力上实现突破。其Instruct版本在SWE-Bench Verified测试中斩获69.6分。同时,下一代基础模型架构Qwen3-Next及系列模型也发布,该模型总参数80B仅激活3B,性能即可媲美千问3旗舰版235B模型,实现了模型计算效率的重大突破。Qwen3-Next采用混合注意力机制、高稀疏度MoE结构、多token预测(MTP)机制等核心技术,模型训练成本较密集模型大降超90%,长文本推理吞吐量提升10倍以上,为未来大模型的训练和推理效率设立了新标准。

活动当天,阿里通义旗舰模型Qwen3-Max全新亮相,总参数超过万亿,拥有Coding编程能力和Agent工具调用能力,其Instruct版本在SWE-Bench Verified测试中斩获69.6分。同时发布的下一代基础模型架构Qwen3-Next及系列模型,模型总参数80B仅激活3B,性能即可媲美千问3旗舰版235B模型,实现了模型计算效率的重大突破。Qwen3-Next针对大模型的持续扩展趋势而设计,创新采用了混合注意力机制、高稀疏度MoE结构、多token预测(MTP)机制等核心技术,使模型训练成本较密集模型Qwen3-32B大降超90%,长文本推理吞吐量提升10倍以上,为未来大模型的训练和推理效率设立了新标准。

Agent开发与平台升级

一站式模型服务和Agent开发平台阿里云百炼在大会上进行了重磅升级。阿里云发布全新Agent开发框架ModelStudio-ADK,该框架突破了预定义编排方式的局限,可帮助企业高效开发具备自主决策、多轮反思和循环执行能力的Agent。使用ModelStudio-ADK,1个小时就能轻松开发一个能生成深度报告的Deep Research项目。得益于模型能力的不断提升和Agent应用的普及,过去一年,阿里云百炼平台的模型日均调用量增长了15倍。

在2025杭州云栖大会上,一站式模型服务和Agent开发平台阿里云百炼重磅升级,发布全新Agent开发框架ModelStudio-ADK。该框架突破了预定义编排方式开发Agent的局限,可帮助企业高效开发具备自主决策、多轮反思和循环执行能力的Agent。使用ModelStudio-ADK,1个小时就能轻松开发一个能生成深度报告的Deep Research项目。随着模型能力的不断提升以及Agent应用的普及,过去一年,阿里云百炼平台的模型日均调用量增长了15倍。

AI基础设施与算力突破总结

在服务器层面,阿里云发布全新一代磐久128超节点AI服务器。这款由阿里云自主研发设计的超节点服务器具备高密度、高性能和高可用的核心优势,单柜支持128个AI计算芯片,刷新业界密度纪录。磐久超节点集成了阿里自研CIPU 2.0芯片和EIC/MOC高性能网卡,可实现高达Pb/s级别Scale-Up带宽和百ns极低延迟。相对于传统架构,同等AI算力下推理性能还可提升50%,为阿里云打造"AI超级计算机"提供了坚实的算力基础。

在服务器层面,阿里云发布全新一代磐久128超节点AI服务器。新一代磐久超节点服务器由阿里云自主研发设计,具备高密度、高性能和高可用的核心优势,可高效支持多种AI芯片,单柜支持128个AI计算芯片,密度刷新业界纪录。磐久超节点集成阿里自研CIPU 2.0芯片和EIC/MOC高性能网卡,采用开放架构,扩展能力极强,可实现高达Pb/s级别Scale-Up带宽和百ns极低延迟,同等AI算力下推理性能还可提升50%。这为阿里云打造"AI超级计算机"提供了坚实的基础。

相关推荐
candyTong13 小时前
Claude Code 的 Edit 工具是怎么工作的
javascript·后端·架构
AI医影跨模态组学13 小时前
EBioMedicine美国佐治亚理工学院与埃默里大学:基于深度学习的放射组学与病理学多模态融合预测HPV相关口咽鳞状细胞癌预后
人工智能·深度学习·论文·医学·医学影像·影像组学
Agent手记13 小时前
异常考勤智能预警与处理与流程优化方案 | 基于企业级Agent的超自动化实战教程
运维·人工智能·ai·自动化
2601_9577875813 小时前
矩阵运营的技术底座:为什么“一体化系统“正在取代“工具拼装“
人工智能·矩阵·矩阵运营
冬奇Lab13 小时前
Agent 系列(一):Agent 是什么——不只是「会调工具的 LLM」
人工智能·llm·agent
冬奇Lab13 小时前
RAG 系列(二十四):代码 RAG——让 AI 理解你的代码库
人工智能·llm
南屹川14 小时前
【算法】动态规划实战:从入门到精通
人工智能
人工智能培训14 小时前
大模型与传统小模型、传统NLP模型的核心差异解析
人工智能·深度学习·神经网络·机器学习·生成对抗网络
沪漂阿龙14 小时前
面试题详解:智能客服 Agent 系统全栈拆解——Rasa Pro、对话管理、意图识别、GraphRAG、Qwen 与 RAG 优化实战
人工智能·架构