就在前天凌晨!当AI圈还在回味各路神仙打架时,沉寂已久的MiniMax突然扔出了一记重磅炸弹,开启了他们的"MiniMax Week"!第一天就直接王炸------开源首个推理模型M1!这波操作,直接给我整不会了...出手就是开源,还是在这么阴间的时间点,真的行!

我先说结论:M1凭借1M的超长上下文和恐怖的推理性能,足以媲美Gemini 2.5 Pro,我愿敬称为新一代开源战神! 这不是又一个刷分的模型,这是一个真正为Agent时代打造的、能"干重活"的长推理底座,性价比直接拉满,让DeepSeek和Kimi瞬间emo!

如何体验
MiniMax Agent 已进入内测。
可通过 Google 账号登录官网 https://agent.minimax.io/
免费尝鲜。
性能屠榜!1M上下文把Gemini拉下神坛?
是骡子是马拉出来遛遛,直接看跑分!在多个核心基准上,M1的表现只能用"炸裂"来形容,尤其是在「超长」上下文、软件工程和工具调用等维度,直接超越了Qwen3和DeepSeek-R1等一众开源好手。
这个上下文是什么概念?简单来说,可以一口气生成3万字的内容。。我去,这不就一篇短篇小说了吗

图片
但最离谱的,还是MRCR(4-needle)这项测试!很多人不知道这是个啥,简单说,它就是"大海捞针"测试的究极进化版,专门考察模型在超长对话中精准回溯和理解复杂指代关系的能力。在这个地狱难度的测试里,M1的表现简直一柱擎天,直接屠榜,跟闭源王者Gemini 2.5 Pro肩并肩!我相信用过Gemini 2.5 Pro的伙伴都知道,那玩意的上下文有多离谱,而现在,一个开源模型做到了!我特么...这波直接干碎了所有人的质疑!
技术扒一扒:省钱又省力,这波操作怎么做到的?
M1之所以能这么横,背后是硬核的技术创新,招招打在效率和成本的痛点上。
首先是Lightning Attention机制。这玩意儿是实现1M超长上下文的核武器!它把传统注意力机制O(L²)的平方级计算复杂度,硬生生压到了近似O(L)的线性级别。这意味着什么?在生成10万token时,M1的计算量(FLOPs)不到DeepSeek R1的一半,生成100K时更是只有后者的25%!这效率,简直离谱!

图片
其次是高达80K的"思考预算" 。这才是"长推理"的关键!光能吃进长文本不算本事,能进行超长的、连贯的思考和输出,才是真功夫。80K的输出token,意味着M1在面对复杂任务时,可以写出极其详尽的思考过程,一步步拆解、验证、反思,而不是浅尝辄止。这为智能体(Agent)的复杂规划能力提供了坚实的底座。
最后是自研的CISPO 强化学习 算法。M1基于456B参数的MoE架构(激活45.9B),但其强化学习(RL)成本低到令人发指:仅用512张H800,3周时间,花了53.47万美元就完成了!背后的功臣就是CISPO,这个骚方法通过裁剪重要性采样权重,极大提升了训练效率,实现了2倍加速。这不仅是技术上的胜利,更是对成本控制的极致诠释,把"性价比"三个字刻在了骨子里。
实测为王!这玩意儿真的能干活吗?
跑分再牛,不如实战。我们把它丢进了一些真实的、甚至变态的场景里,看看它到底能不能打!
测试一:超长上下文处理
MiniMax Agent 基于其自研的 ABAB-01 系列模型,支持高达 400 万 token 的超长上下文窗口。
这相当于什么概念?就是它能一口气读完《明朝那些事儿》,然后你问它"朱元璋在哪里第一次见到齐德",它就能精准地告诉你。
针对"长上下文处理"能力的信息提取测试:
我把书籍《穷爸爸富爸爸》的PDF丢给了它,让它给这本书写概括和相关建议。之前用DeepSeek测,直接提示只读了23%就崩了。而M1,出色地完成了任务,超长上下文的魅力体现得淋漓尽致!
这体验,真的无敌!


图片
测试二:PPT 制作
在这次更新中,一大亮点是能做漂亮的 PPT------职场牛马必备技能。
对于 MiniMax Agent 来说,PPT 也是多模态的一种。看上去只是图片和文字的结合,但无论从排版、内容和图案设计来讲,都得有主题、有思路、有逻辑,讲究一致性,并且还能根据主题主动补全内容,这才算是解放我们双手的ai。
来自官方的一个案例:
帮我做一个面向初中生讲解动量守恒的ppt
最终生成的PPT截图:
访问:vdq166psnf.space.minimax.io/


添加图片注释,不超过 140 字(可选)
测试三:编程能力(小槽点)
在代码生成方面,M1能力在线,比如让它做一个"打地鼠"游戏,很快就能生成可玩版本。但不得不吐槽一下,前端审美...有点直男。跟Gemini生成的页面一比,确实还有进步空间。不过,瑕不掩瑜,功能实现是第一位的!
游戏开发测试:
使用 HTML, CSS, 和 JavaScript 创建一个简单的网页版"打地鼠"游戏。规则如下:
游戏界面是一个 4x4 的网格。
每隔 1-2 秒,会有一只"地鼠"随机出现在一个格子里。
玩家点击"地鼠"即可得分,分数需要实时显示。
游戏包含一个"开始/重新开始"按钮和一个 30 秒的倒计时。 请将所有代码打包到一个 index.html 文件中。


写在最后
MiniMax M1的发布,无疑是给火热的AI圈又浇上了一桶油!它不仅在性能上实现了对开源竞品的超越,甚至在核心长文能力上直接挑战闭源王者Gemini,更重要的是,它通过一系列技术创新,展示了一条"高性能+高效率+低成本"的可行路径。
这与还在纠结是自研还是基于别家模型二次开发的Kimi形成了鲜明对比。MiniMax这种"左手模型,右手Agent"的打法,稳扎稳打,正在构建一个从底层模型到上层应用、数据飞轮自洽的坚固生态。
当别人还在为高昂的token成本发愁时,MiniMax已经把价格打了下去,把智能提了上来。
这一周,MiniMax的好戏才刚刚开始。让子弹再飞一会儿,让我们继续围观,看AI的这一把火,还能烧得多么热烈!
本文由稀土掘金作者【饼干哥哥】,微信公众号:【饼干哥哥AGI】,原创/授权 发布于稀土掘金,未经许可,禁止转载。