1美元雇佣顶级架构师?MiniMax M2.5要把Agent价格打穿

2026年的AI春节档刚过,MiniMax就扔出了一枚重磅炸弹。

2月13日,MiniMax M2.5正式上线。这一次,他们没有像往常那样单纯去卷参数量或者在这个榜那个榜上争个你死我活,而是把枪口对准了一个更现实、更痛的问题:怎么让AI Agent真的用得起,而且真的能干活。

这就好比以前我们都在比谁家的法拉利跑得快,但MiniMax突然造出了一辆跑得比法拉利还快,但油耗只有五菱宏光的车。

告别"码农",迎来"架构师"

过去的大模型在写代码时,往往像个听话的初级程序员:你给一个指令,它写一段代码。一旦需求复杂,它就开始胡编乱造。

M2.5最大的进化在于它演化出了**"原生Spec能力"**。简单来说,它在动手写代码之前,会先像在这个行业摸爬滚打多年的架构师一样,进行拆解和规划。

数据不会撒谎。在公认最硬核的编程榜单 SWE-Bench Verified 上,M2.5拿到了 80.2% 的分数。这不仅是SOTA(当前最佳)水平,更是在多语言任务(Multi-SWE-Bench)上以 51.3% 的成绩拿下了全球第一,直接把Claude Opus 4.6甩在身后。

这意味着,它不再是一个只能补全代码的插件,而是一个能独立处理复杂工程、甚至能自己改Bug的虚拟员工。

算一笔让老板心动的账

如果不谈成本,谈AI落地都是耍流氓。M2.5最可怕的地方不在于它有多聪明,而在于它把"聪明"变得极其廉价。

来看看这个离谱的经济模型:

  • 推理速度:100 TPS(每秒处理100个token),是目前主流模型的2倍。
  • 运行成本 :如果你让它全速运转(100 TPS),一小时的成本仅为 1美元 。如果你不需要那么快(50 TPS),一小时只要 0.3美元

MiniMax给出了一个非常具象的换算:给你1万美元预算,你可以雇佣4个由M2.5驱动的顶尖Agent,让它们不眠不休地连续工作整整一年。

相比之下,Claude Opus、GPT-5等模型的成本是它的10倍甚至20倍。对于想要规模化部署Agent的企业来说,这不仅仅是省钱,而是把"不可行"变成了"可行"。

既然这么强,MiniMax自己用了吗?

很多模型厂商发布产品时吹得天花乱坠,自己内部开发却还要靠别人的模型。但MiniMax这次搞了一波"吃自己的狗粮"。

根据官方披露的数据,M2.5已经全面渗透进了MiniMax的内部业务。现在,他们内部 30% 的整体任务完全由M2.5自主完成,覆盖了从产品、销售到财务的各个环节。

更夸张的是在研发端:MiniMax新提交的代码中,有80%是由M2.5生成的。 这不是辅助,这是主力。

技术背后的"暴力美学"

为什么M2.5能在这个时间点实现性能和成本的双重突围?

核心在于技术底座的重构。过去108天,MiniMax把模型从M2迭代到了M2.5,这背后是他们自研的Forge框架和大规模强化学习(RL Scaling)在发力。

他们并没有单纯堆砌参数(激活参数量仅10B),而是通过CISPO算法和过程奖励机制,让模型学会了"精打细算"。它知道在什么地方该深思熟虑(Thinking Token),在什么地方该快速掠过。结果就是,在BrowseComp等搜索任务中,它的轮次消耗减少了20%,但任务完成速度却比上一代快了37%。

写在最后

MiniMax M2.5的发布,其实释放了一个信号:大模型正在从"炫技时代"进入"务实时代"。

当一个模型具备了架构师级别的思考能力,同时价格低到像水电一样时,所谓的"原生Agent"就不再是一个营销概念,而是真正能跑在每一个服务器、每一台PC甚至每一个APP里的生产力。

对于开发者和企业来说,现在的门槛不再是技术,而是想象力。毕竟,当雇佣一个顶级专家的成本只要几毛钱时,你还有什么理由不让他去干活呢?

如果你也对最新的AI信息感兴趣或者有疑问 都可以加入我的大家庭 第一时间分享最新AI资讯、工具、教程、文档 欢迎你的加入!!!😉😉😉

公众号:墨风如雪小站

相关推荐
reddingtons6 小时前
Magnific AI:拒绝“马赛克”?AI 幻觉重绘流,拯救 1024px 废片
图像处理·人工智能·设计模式·新媒体运营·aigc·设计师·教育电商
后端小肥肠8 小时前
从n8n到Claude Skills:轻松搞定小红书热门美食手账,3分钟出图,小白也能会!
人工智能·aigc·agent
大龄程序员8 小时前
TypeScript 类型体操:如何为 SDK 编写优雅的类型定义
前端·aigc
大龄程序员8 小时前
别再用 ID 定位了!教你用"语义指纹"实现 99% 的元素定位成功率
前端·aigc
大龄程序员9 小时前
Vite 插件开发实战:如何自动注入 SDK 脚本
前端·aigc
孟健9 小时前
AI 编程的临界点:当三家巨头同时宣布我们不写代码了
aigc·ai编程
陌晨9 小时前
seedance 2.0,让创作者成为内容可控的导演,附免费体验教程
aigc
阿杰学AI10 小时前
AI核心知识100——大语言模型之 LM Arena(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·模型评测·lm arena
猫头虎10 小时前
【汉化中文版】OpenClaw(Clawdbot/Moltbot)第三方开源汉化中文发行版部署全指南:一键脚本/Docker/npm 三模式安装+Ubuntu 环境配置+中文汉化界面适配开源版
docker·npm·开源·aigc·ai编程·远程工作·openclaw