MiniMax M1开源:一口气生成3万字吊打Gemini,智能体性价比完胜DeepSeek?

就在前天凌晨!当AI圈还在回味各路神仙打架时,沉寂已久的MiniMax突然扔出了一记重磅炸弹,开启了他们的"MiniMax Week"!第一天就直接王炸------开源首个推理模型M1!这波操作,直接给我整不会了...出手就是开源,还是在这么阴间的时间点,真的行!

我先说结论:M1凭借1M的超长上下文和恐怖的推理性能,足以媲美Gemini 2.5 Pro,我愿敬称为新一代开源战神! 这不是又一个刷分的模型,这是一个真正为Agent时代打造的、能"干重活"的长推理底座,性价比直接拉满,让DeepSeek和Kimi瞬间emo!

如何体验

MiniMax Agent 已进入内测。

可通过 Google 账号登录官网 https://agent.minimax.io/ 免费尝鲜。

性能屠榜!1M上下文把Gemini拉下神坛?

是骡子是马拉出来遛遛,直接看跑分!在多个核心基准上,M1的表现只能用"炸裂"来形容,尤其是在「超长」上下文、软件工程和工具调用等维度,直接超越了Qwen3和DeepSeek-R1等一众开源好手。

这个上下文是什么概念?简单来说,可以一口气生成3万字的内容。。我去,这不就一篇短篇小说了吗

图片

但最离谱的,还是MRCR(4-needle)这项测试!很多人不知道这是个啥,简单说,它就是"大海捞针"测试的究极进化版,专门考察模型在超长对话中精准回溯和理解复杂指代关系的能力。在这个地狱难度的测试里,M1的表现简直一柱擎天,直接屠榜,跟闭源王者Gemini 2.5 Pro肩并肩!我相信用过Gemini 2.5 Pro的伙伴都知道,那玩意的上下文有多离谱,而现在,一个开源模型做到了!我特么...这波直接干碎了所有人的质疑!

技术扒一扒:省钱又省力,这波操作怎么做到的?

M1之所以能这么横,背后是硬核的技术创新,招招打在效率和成本的痛点上。

首先是Lightning Attention机制。这玩意儿是实现1M超长上下文的核武器!它把传统注意力机制O(L²)的平方级计算复杂度,硬生生压到了近似O(L)的线性级别。这意味着什么?在生成10万token时,M1的计算量(FLOPs)不到DeepSeek R1的一半,生成100K时更是只有后者的25%!这效率,简直离谱!

图片

其次是高达80K的"思考预算" 。这才是"长推理"的关键!光能吃进长文本不算本事,能进行超长的、连贯的思考和输出,才是真功夫。80K的输出token,意味着M1在面对复杂任务时,可以写出极其详尽的思考过程,一步步拆解、验证、反思,而不是浅尝辄止。这为智能体(Agent)的复杂规划能力提供了坚实的底座。

最后是自研的CISPO 强化学习 算法。M1基于456B参数的MoE架构(激活45.9B),但其强化学习(RL)成本低到令人发指:仅用512张H800,3周时间,花了53.47万美元就完成了!背后的功臣就是CISPO,这个骚方法通过裁剪重要性采样权重,极大提升了训练效率,实现了2倍加速。这不仅是技术上的胜利,更是对成本控制的极致诠释,把"性价比"三个字刻在了骨子里。

实测为王!这玩意儿真的能干活吗?

跑分再牛,不如实战。我们把它丢进了一些真实的、甚至变态的场景里,看看它到底能不能打!

测试一:超长上下文处理

MiniMax Agent 基于其自研的 ABAB-01 系列模型,支持高达 400 万 token 的超长上下文窗口。

这相当于什么概念?就是它能一口气读完《明朝那些事儿》,然后你问它"朱元璋在哪里第一次见到齐德",它就能精准地告诉你。

针对"长上下文处理"能力的信息提取测试:

我把书籍《穷爸爸富爸爸》的PDF丢给了它,让它给这本书写概括和相关建议。之前用DeepSeek测,直接提示只读了23%就崩了。而M1,出色地完成了任务,超长上下文的魅力体现得淋漓尽致!

这体验,真的无敌!

图片

测试二:PPT 制作

在这次更新中,一大亮点是能做漂亮的 PPT------职场牛马必备技能。

对于 MiniMax Agent 来说,PPT 也是多模态的一种。看上去只是图片和文字的结合,但无论从排版、内容和图案设计来讲,都得有主题、有思路、有逻辑,讲究一致性,并且还能根据主题主动补全内容,这才算是解放我们双手的ai。

来自官方的一个案例:

帮我做一个面向初中生讲解动量守恒的ppt

最终生成的PPT截图:

访问:vdq166psnf.space.minimax.io/

添加图片注释,不超过 140 字(可选)

测试三:编程能力(小槽点)

在代码生成方面,M1能力在线,比如让它做一个"打地鼠"游戏,很快就能生成可玩版本。但不得不吐槽一下,前端审美...有点直男。跟Gemini生成的页面一比,确实还有进步空间。不过,瑕不掩瑜,功能实现是第一位的!

游戏开发测试:

使用 HTML, CSS, 和 JavaScript 创建一个简单的网页版"打地鼠"游戏。规则如下:

游戏界面是一个 4x4 的网格。

每隔 1-2 秒,会有一只"地鼠"随机出现在一个格子里。

玩家点击"地鼠"即可得分,分数需要实时显示。

游戏包含一个"开始/重新开始"按钮和一个 30 秒的倒计时。 请将所有代码打包到一个 index.html 文件中。

写在最后

MiniMax M1的发布,无疑是给火热的AI圈又浇上了一桶油!它不仅在性能上实现了对开源竞品的超越,甚至在核心长文能力上直接挑战闭源王者Gemini,更重要的是,它通过一系列技术创新,展示了一条"高性能+高效率+低成本"的可行路径。

这与还在纠结是自研还是基于别家模型二次开发的Kimi形成了鲜明对比。MiniMax这种"左手模型,右手Agent"的打法,稳扎稳打,正在构建一个从底层模型到上层应用、数据飞轮自洽的坚固生态。

当别人还在为高昂的token成本发愁时,MiniMax已经把价格打了下去,把智能提了上来。

这一周,MiniMax的好戏才刚刚开始。让子弹再飞一会儿,让我们继续围观,看AI的这一把火,还能烧得多么热烈!

本文由稀土掘金作者【饼干哥哥】,微信公众号:【饼干哥哥AGI】,原创/授权 发布于稀土掘金,未经许可,禁止转载。

相关推荐
loong_XL9 小时前
fastmcp MCPConfig多服务器使用案例;sse、stdio、streamable-http使用
服务器·agent·mcp
数据智能老司机2 天前
Gemini 2.5 深度解读:Google 如何重新定义下一代 AI?
llm·agent·产品
成都犀牛2 天前
工作流和Agent 的区别与联系
人工智能·python·深度学习·神经网络·agent·工作流
从善若水2 天前
【6G技术探索】MCP协议整理分享
ai·agent·6g·mcp
MarkGosling2 天前
【资源合集】强化学习训练LLM Agents的实战资源库:AgentsMeetRL
llm·agent·强化学习
AI大模型3 天前
AI大模型应用开发(四)用LangChain构建带Agent流程的RAG系统
langchain·llm·agent
东哥说AI3 天前
AI的“魔法”已过,真正的“内功”比拼才刚刚开始
人工智能·agent·ai编程
AI袋鼠帝3 天前
字节出手了!5分钟搞定一个商用AI Agent(智能体),太丝滑了~【喂饭级教程】
aigc·agent·ai编程
数据智能老司机4 天前
AI产品开发的艺术——用代理式人工智能实现工作流自动化
llm·agent·产品