编程最强的模型,竟然变成了国产的它

OpenRouter 是一个聚合了上百个模型的 API 调用平台,每周和每月会发布一次模型排行榜。

最近这个榜单的格局,变了。

本月「模型排行榜」的前 10 名里,国产模型占了 4 席:

第 1 名 MiniMax M2.5(5.26T tokens)

第 2 名 Kimi K2.5(4.23T tokens,环比增长 5221%)

第 4 名 DeepSeek V3.2

第 8 名 GLM-5

而「编程排行榜」的前 10 名里,国产模型同样有 4 个:

第 1 名 MiniMax M2.5

第 2 名 GLM-5

第 4 名 MiniMax M2.1

第 5 名 Kimi K2.5

出乎意料的是,国产的 MiniMax M2.5 成为了本月 AI 模型榜单的整体第一名,包括编程领域!

它的核心优势有两点:

  1. 编程能力还不错:M2.5 的 SWE-Bench Verified 得分 80.2%,编程能力接近行业顶尖;Multi-SWE-Bench(多语言编程)达到 51.3%。端到端完成一个 SWE-Bench 任务只需 22.8 分钟,比 Claude Opus 4.6 的 22.9 分钟还快 0.1。

2.价格实惠:token 费用是 Claude Sonnet 4.6的六分之一左右。98/月可以满足常规使用,再不够还有其他档位。

让我欣喜的是,从中外模型格局上看,国产模型的编程能力已经逐渐进入国际前列,相信用不了多久,我们就可以打破「国外模型更好」的迷信,期待那一天!

你使用哪个模型更多?欢迎留言讨论~

# 我的 Agent 开发转型完整经历

相关推荐
小雨下雨的雨16 小时前
井字棋AI机器人实现详解 - Minimax算法实战-鸿蒙PC Electron框架完成
前端·人工智能·算法·华为·electron·鸿蒙
ZC跨境爬虫20 小时前
跟着 MDN 学JavaScript day_7:数学运算与逻辑判断实战测试
开发语言·前端·javascript·学习·ecmascript
fangdengfu12320 小时前
ES分析系统各个服务日志占用量
java·前端·elasticsearch
宅小年21 小时前
Codex 大更新!不只写代码,6 套职业技能,开始接手知识工作流
openai·ai编程
宅小年21 小时前
DeepSeek-V4-Pro 官宣 2.5 折转为正式价格后,我把它接入了 Claude Code
ai编程
宅小年21 小时前
微信读书出了 Skill,但我最关心的不是 AI 总结书
ai编程
JustHappy1 天前
古法编程秘籍(六):程序到底是怎么跑起来的?从 IO 到中断,一次讲明白
前端·后端·全栈
灵感__idea1 天前
《AI工程》:高质量提示词怎样设计?
aigc·openai·ai编程
HYCS1 天前
用pixi.js实现fabric.js(六):从线性代数的角度理解编辑器交互
前端·javascript·canvas