MiniMax发布新一代大模型M3 编程能力评测超越GPT-5.5

财迅通Ai2026-06-06 16:31

2026年6月1日，国产大模型公司稀宇科技（MiniMax）正式发布新一代通用模型MiniMax M3。该模型采用自研稀疏注意力架构MSA，在编程能力、超长上下文及原生多模态三个方向实现同步突破。

据MiniMax官方披露，在衡量编程能力的基准测试SWE-Bench Pro上，M3取得59.0%的得分，超过了OpenAI的GPT-5.5和谷歌的Gemini 3.1 Pro，接近Anthropic的Claude Opus 4.7。在考察多模态文档解析能力的OmniDocBench测试及评估智能体能力的Claw-Eval评测中，M3均超过Gemini 3.1 Pro。

M3的核心技术突破在于其自研的稀疏注意力架构MSA（MiniMax Sparse Attention）。相较传统全注意力机制，MSA能够显著降低长上下文下的计算成本，并将上下文窗口提升至100万token。MiniMax披露，在100万上下文规模下，M3单token计算量仅为上一代模型的约1/20，prefilling阶段加速超过9倍，decoding阶段加速超过15倍。

公开资料显示，M3是国内首个同时具备"前沿Coding能力、1M超长上下文、原生多模态"三项核心能力的大模型，也是目前全球唯一具备完整能力组合的开源选项。作为原生多模态模型，M3支持图片和视频的输入，并能操作电脑桌面，实现跨应用、跨文件、跨系统的复杂任务操作。

伴随模型发布，MiniMax同步推出了AI编程产品MiniMax Code。据官方介绍，其智能体集群可将大型任务拆解为多个可并发、可动态调整的阶段，以协作方式持续推进。在官方展示中，M3自主运行近12个小时，成功复现了一篇获奖AI论文《Learning Dynamics of LLM Finetuning》，验证了原论文提出的核心发现。

商业化方面，MiniMax同步推出Token Plan订阅方案。Plus版每月49元提供6亿token，Max版每月119元提供18亿token，Ultra版每月469元提供55亿token。API定价方面，512k上下文以内输入价格为每百万Tokens 4.2元，输出价格为每百万Tokens 16.8元。官方同步开启了为期7天的API五折优惠活动。

MiniMax表示，M3的技术报告及完整模型权重将在10天内面向全球开发者正式开源。京东云同日宣布，其JoyBuilder模型开发平台已第一时间接入MiniMax M3模型并开放服务。