万亿参数!阿里 Qwen3-Max 大模型正式发布!

万亿参数!阿里 Qwen3-Max 大模型正式发布!

核心亮点先摆这儿:

9 月 24 日云栖大会刚发的 Qwen3-Max,参数超 1 万亿,LMArena 榜单干过 GPT-5-Chat 拿第三;

编程能力 69.6 分(SWE-Bench),写代码堪比资深程序员;

API 输入最低 0.006 元 / 千 token,Qwen Chat 还能免费薅;

分 Base、Instruct、Thinking 三个版本,Instruct 版已能直接用。

null

image-20250925153241195

发布会现场直击:万亿参数模型登场

9 月 24 日云栖大会开幕式上,通义千问团队一亮相就炸了场 ------Qwen3-Max 正式发布,号称 "阿里史上最强"。现场屏幕闪过关键数据:总参数超 1 万亿,预训练啃了 36T tokens 的数据,比上一代模型多了不止一个量级。最惊喜的是 Instruct 版当天就上线了 Qwen Chat(chat.qwen.ai)和阿里云百炼平台,不用等内测直接冲。

null

image-20250925153423888

阿里这波属于 "发布会即上线",比某些 "画饼半年不上线" 的厂商实在多了,手速快的已经开始用它写周报了。

性能实测:真能打过 GPT-5-Chat?

先看权威榜单:LMArena 文本排行榜里,Qwen3-Max 排全球第三,直接把 GPT-5-Chat 挤到第四。编程圈最认的 SWE-Bench Verified 测试里,它拿了 69.6 分,意味着现实中 69.6% 的编程 bug 能靠它解决。我试了个复杂的 Python 数据可视化需求,以前得调半小时的代码,它 1 分钟就出了可运行版本,还贴心加了注释。

null

image-20250925153510915

用榜单数据和实测体验说话,不是空喊 "性能强"。简单说,写代码、处理文本这些活儿,它已经是全球第一梯队水平。

价格刺客?不,是阶梯友好型

阿里云百炼的定价表很实在:输入分三档,0-32k token 只要 0.006 元 / 千 token,就算用到 252k 长文本,也才 0.015 元 / 千 token;输出对应 0.024 到 0.06 元 / 千 token。对比上一代 Qwen-Max-0919 的固定价,现在小用量用户能省一大笔,比如写篇 500 字短文,输入输出加起来才几分钱。

null

image-20250925153610140

小打小闹几乎不花钱,企业批量用也扛得住,比某些 "按次收费" 的模型良心多了。

万亿参数咋练出来的?

Qwen3-Max 用了 MoE 模型结构,还加了 "global-batch load balancing loss" 技术,训练时没出现过 loss 尖刺,一气呵成。更牛的是训练效率:MFU 比上一代高 30%,长序列训练吞吐快 3 倍,硬件故障损失还降了五分之四。简单说,阿里把 "练 AI" 的成本和时间都压下来了。

解释:这些技术词看着唬人,核心就是 "花更少钱、更少时间,练出更强模型"。对用户来说,这意味着后续模型更新会更快,成本也难涨上去。

虽然没正式上线,但团队放了个大招:Qwen3-Max-Thinking 推理增强版,在 AIME 25、HMMT 这些数学基准测试里都拿了满分,甚至达到奥林匹克数学竞赛满分水平。这意味着以后解复杂数学题、做逻辑推理,它可能比学霸还靠谱。

结尾聊两句:你最想用它干啥?

Qwen3-Max 这波发布,既有能立刻上手的 Instruct 版,又有让人期待的 Thinking 版,价格还挺亲民。不管是写代码、处理长文档,还是以后解数学题,好像都能派上用场。

相关推荐
LaughingZhu3 小时前
Product Hunt 每日热榜 | 2026-04-10
人工智能·经验分享·深度学习·神经网络·产品运营
数据知道3 小时前
claw-code 源码分析:OmX `$team` / `$ralph`——把 AI 辅助开发从偶发灵感变成可重复流水线
数据库·人工智能·mysql·ai·claude code·claw code
manduic4 小时前
告别传统编码器痛点!麦歌恩MT6701,重构位置检测选型新逻辑
人工智能·重构·磁性角度传感器
ai大模型中转api测评4 小时前
告别文字堆砌:Gemini 交互 API 赋能垂直领域,开发者如何重构用户认知?
人工智能·重构·交互·api
陌殇殇4 小时前
002 Spring AI Alibaba框架整合百炼大模型平台 — 聊天、文生图、语音、向量模型整合
人工智能·spring·ai
南湖北漠4 小时前
记录生活中的那些小事(佚名)
网络·人工智能·计算机网络·其他·安全·生活
清水白石0084 小时前
《解锁 Python 潜能:从核心语法到 AI 服务层架构的工业级进阶与实战》
人工智能·python·架构
大连好光景4 小时前
学会评估模型的拟合状态和泛化能力
人工智能·机器学习
老兵发新帖4 小时前
Hermes:openclaw的最佳替代之基于源码部署的飞书配置
人工智能·飞书
weixin_513449964 小时前
walk_these_ways项目学习记录第七篇(通过行为多样性 (MoB) 实现地形泛化)--核心环境下
人工智能·python·学习