MiniMax M1开源：一口气生成3万字吊打Gemini，智能体性价比完胜DeepSeek？

就在前天凌晨！当AI圈还在回味各路神仙打架时，沉寂已久的MiniMax突然扔出了一记重磅炸弹，开启了他们的"MiniMax Week"！第一天就直接王炸------开源首个推理模型M1！这波操作，直接给我整不会了...出手就是开源，还是在这么阴间的时间点，真的行！

我先说结论：M1凭借1M的超长上下文和恐怖的推理性能，足以媲美Gemini 2.5 Pro，我愿敬称为新一代开源战神！ 这不是又一个刷分的模型，这是一个真正为Agent时代打造的、能"干重活"的长推理底座，性价比直接拉满，让DeepSeek和Kimi瞬间emo！

如何体验

MiniMax Agent 已进入内测。

可通过 Google 账号登录官网 https://agent.minimax.io/ 免费尝鲜。

性能屠榜！1M上下文把Gemini拉下神坛？

是骡子是马拉出来遛遛，直接看跑分！在多个核心基准上，M1的表现只能用"炸裂"来形容，尤其是在「超长」上下文、软件工程和工具调用等维度，直接超越了Qwen3和DeepSeek-R1等一众开源好手。

这个上下文是什么概念？简单来说，可以一口气生成3万字的内容。。我去，这不就一篇短篇小说了吗

图片

但最离谱的，还是MRCR（4-needle）这项测试！很多人不知道这是个啥，简单说，它就是"大海捞针"测试的究极进化版，专门考察模型在超长对话中精准回溯和理解复杂指代关系的能力。在这个地狱难度的测试里，M1的表现简直一柱擎天，直接屠榜，跟闭源王者Gemini 2.5 Pro肩并肩！我相信用过Gemini 2.5 Pro的伙伴都知道，那玩意的上下文有多离谱，而现在，一个开源模型做到了！我特么...这波直接干碎了所有人的质疑！

技术扒一扒：省钱又省力，这波操作怎么做到的？

M1之所以能这么横，背后是硬核的技术创新，招招打在效率和成本的痛点上。

首先是Lightning Attention机制。这玩意儿是实现1M超长上下文的核武器！它把传统注意力机制O(L²)的平方级计算复杂度，硬生生压到了近似O(L)的线性级别。这意味着什么？在生成10万token时，M1的计算量（FLOPs）不到DeepSeek R1的一半，生成100K时更是只有后者的25%！这效率，简直离谱！

图片

其次是高达80K的"思考预算" 。这才是"长推理"的关键！光能吃进长文本不算本事，能进行超长的、连贯的思考和输出，才是真功夫。80K的输出token，意味着M1在面对复杂任务时，可以写出极其详尽的思考过程，一步步拆解、验证、反思，而不是浅尝辄止。这为智能体（Agent）的复杂规划能力提供了坚实的底座。

最后是自研的CISPO 强化学习 算法。M1基于456B参数的MoE架构（激活45.9B），但其强化学习（RL）成本低到令人发指：仅用512张H800，3周时间，花了53.47万美元就完成了！背后的功臣就是CISPO，这个骚方法通过裁剪重要性采样权重，极大提升了训练效率，实现了2倍加速。这不仅是技术上的胜利，更是对成本控制的极致诠释，把"性价比"三个字刻在了骨子里。

实测为王！这玩意儿真的能干活吗？

跑分再牛，不如实战。我们把它丢进了一些真实的、甚至变态的场景里，看看它到底能不能打！

测试一：超长上下文处理

MiniMax Agent 基于其自研的 ABAB-01 系列模型，支持高达 400 万 token 的超长上下文窗口。

这相当于什么概念？就是它能一口气读完《明朝那些事儿》，然后你问它"朱元璋在哪里第一次见到齐德"，它就能精准地告诉你。

针对"长上下文处理"能力的信息提取测试：

我把书籍《穷爸爸富爸爸》的PDF丢给了它，让它给这本书写概括和相关建议。之前用DeepSeek测，直接提示只读了23%就崩了。而M1，出色地完成了任务，超长上下文的魅力体现得淋漓尽致！

这体验，真的无敌！

图片

测试二：PPT 制作

在这次更新中，一大亮点是能做漂亮的 PPT------职场牛马必备技能。

对于 MiniMax Agent 来说，PPT 也是多模态的一种。看上去只是图片和文字的结合，但无论从排版、内容和图案设计来讲，都得有主题、有思路、有逻辑，讲究一致性，并且还能根据主题主动补全内容，这才算是解放我们双手的ai。

来自官方的一个案例：

帮我做一个面向初中生讲解动量守恒的ppt

最终生成的PPT截图：

访问：vdq166psnf.space.minimax.io/

添加图片注释，不超过 140 字（可选）

测试三：编程能力（小槽点）

在代码生成方面，M1能力在线，比如让它做一个"打地鼠"游戏，很快就能生成可玩版本。但不得不吐槽一下，前端审美...有点直男。跟Gemini生成的页面一比，确实还有进步空间。不过，瑕不掩瑜，功能实现是第一位的！

游戏开发测试：

使用 HTML, CSS, 和 JavaScript 创建一个简单的网页版"打地鼠"游戏。规则如下：

游戏界面是一个 4x4 的网格。

每隔 1-2 秒，会有一只"地鼠"随机出现在一个格子里。

玩家点击"地鼠"即可得分，分数需要实时显示。

游戏包含一个"开始/重新开始"按钮和一个 30 秒的倒计时。请将所有代码打包到一个 index.html 文件中。

写在最后

MiniMax M1的发布，无疑是给火热的AI圈又浇上了一桶油！它不仅在性能上实现了对开源竞品的超越，甚至在核心长文能力上直接挑战闭源王者Gemini，更重要的是，它通过一系列技术创新，展示了一条"高性能+高效率+低成本"的可行路径。

这与还在纠结是自研还是基于别家模型二次开发的Kimi形成了鲜明对比。MiniMax这种"左手模型，右手Agent"的打法，稳扎稳打，正在构建一个从底层模型到上层应用、数据飞轮自洽的坚固生态。

当别人还在为高昂的token成本发愁时，MiniMax已经把价格打了下去，把智能提了上来。

这一周，MiniMax的好戏才刚刚开始。让子弹再飞一会儿，让我们继续围观，看AI的这一把火，还能烧得多么热烈！

本文由稀土掘金作者【饼干哥哥】，微信公众号：【饼干哥哥AGI】，原创/授权发布于稀土掘金，未经许可，禁止转载。