MiniMax发布新一代大模型M3 编程能力评测超越GPT-5.5

2026年6月1日,国产大模型公司稀宇科技(MiniMax)正式发布新一代通用模型MiniMax M3。该模型采用自研稀疏注意力架构MSA,在编程能力、超长上下文及原生多模态三个方向实现同步突破。

据MiniMax官方披露,在衡量编程能力的基准测试SWE-Bench Pro上,M3取得59.0%的得分,超过了OpenAI的GPT-5.5和谷歌的Gemini 3.1 Pro,接近Anthropic的Claude Opus 4.7。在考察多模态文档解析能力的OmniDocBench测试及评估智能体能力的Claw-Eval评测中,M3均超过Gemini 3.1 Pro。

M3的核心技术突破在于其自研的稀疏注意力架构MSA(MiniMax Sparse Attention)。相较传统全注意力机制,MSA能够显著降低长上下文下的计算成本,并将上下文窗口提升至100万token。MiniMax披露,在100万上下文规模下,M3单token计算量仅为上一代模型的约1/20,prefilling阶段加速超过9倍,decoding阶段加速超过15倍。

公开资料显示,M3是国内首个同时具备"前沿Coding能力、1M超长上下文、原生多模态"三项核心能力的大模型,也是目前全球唯一具备完整能力组合的开源选项。作为原生多模态模型,M3支持图片和视频的输入,并能操作电脑桌面,实现跨应用、跨文件、跨系统的复杂任务操作。

伴随模型发布,MiniMax同步推出了AI编程产品MiniMax Code。据官方介绍,其智能体集群可将大型任务拆解为多个可并发、可动态调整的阶段,以协作方式持续推进。在官方展示中,M3自主运行近12个小时,成功复现了一篇获奖AI论文《Learning Dynamics of LLM Finetuning》,验证了原论文提出的核心发现。

商业化方面,MiniMax同步推出Token Plan订阅方案。Plus版每月49元提供6亿token,Max版每月119元提供18亿token,Ultra版每月469元提供55亿token。API定价方面,512k上下文以内输入价格为每百万Tokens 4.2元,输出价格为每百万Tokens 16.8元。官方同步开启了为期7天的API五折优惠活动。

MiniMax表示,M3的技术报告及完整模型权重将在10天内面向全球开发者正式开源。京东云同日宣布,其JoyBuilder模型开发平台已第一时间接入MiniMax M3模型并开放服务。

相关推荐
searchforAI4 小时前
长视频和播客怎么变成结构化读书笔记?一套 AI 时代的知识管理方法
人工智能·笔记·gpt·音视频·语音识别
Nayxxu9 小时前
GPT API 迁移教程:Chat Completions 到 Responses API 的最小改造路径
数据库·gpt
AI智图坊9 小时前
电商详情页转化率提升实战:基于AI的“卖点-视觉”转化链路设计与自动化实现
大数据·运维·人工智能·gpt·ai作画·自动化·aigc
AI设计小站10 小时前
GPT Image2国内可用方案实测:创客贴AI生成+分层编辑能力解析
人工智能·gpt·php
happyprince10 小时前
18-Hugging Face Transformers之GPT-2 案例详解:Decoder-only 自回归模型的完整生命周期
gpt·数据挖掘·回归
烬、、、1 天前
如何用 Claude Code 调用 gpt-image2 生成图片?
人工智能·笔记·gpt·prompt·skills
jike88ai1 天前
Windows版Claude Code安装与API对接教程(附常见问题解决)
windows·gpt·node.js·claude·claudecode·88api
m0_535817551 天前
Mac下Claude Code完整配置指南:API中转+环境变量设置一步到位
gpt·macos·node.js·api·claude·claudecode·88api
searchforAI1 天前
Agent Skills知识库检索比RAG强吗?技术原理拆解
人工智能·gpt·ai·agent·rag·skill·claudecode