编程最强的模型,竟然变成了国产的它

OpenRouter 是一个聚合了上百个模型的 API 调用平台,每周和每月会发布一次模型排行榜。

最近这个榜单的格局,变了。

本月「模型排行榜」的前 10 名里,国产模型占了 4 席:

第 1 名 MiniMax M2.5(5.26T tokens)

第 2 名 Kimi K2.5(4.23T tokens,环比增长 5221%)

第 4 名 DeepSeek V3.2

第 8 名 GLM-5

而「编程排行榜」的前 10 名里,国产模型同样有 4 个:

第 1 名 MiniMax M2.5

第 2 名 GLM-5

第 4 名 MiniMax M2.1

第 5 名 Kimi K2.5

出乎意料的是,国产的 MiniMax M2.5 成为了本月 AI 模型榜单的整体第一名,包括编程领域!

它的核心优势有两点:

  1. 编程能力还不错:M2.5 的 SWE-Bench Verified 得分 80.2%,编程能力接近行业顶尖;Multi-SWE-Bench(多语言编程)达到 51.3%。端到端完成一个 SWE-Bench 任务只需 22.8 分钟,比 Claude Opus 4.6 的 22.9 分钟还快 0.1。

2.价格实惠:token 费用是 Claude Sonnet 4.6的六分之一左右。98/月可以满足常规使用,再不够还有其他档位。

让我欣喜的是,从中外模型格局上看,国产模型的编程能力已经逐渐进入国际前列,相信用不了多久,我们就可以打破「国外模型更好」的迷信,期待那一天!

你使用哪个模型更多?欢迎留言讨论~

# 我的 Agent 开发转型完整经历

相关推荐
Highcharts.js18 小时前
Highcharts 云端渲染的真相:交互式图表与服务器端生成的边界
前端·信息可视化·服务器渲染·highcharts·图表渲染
zhuyan10819 小时前
Linux 系统磁盘爆满导致无法启动修复指南
前端·chrome
编程牛马姐19 小时前
独立站SEO流量增长:提高Google排名的优化方法
前端·javascript·网络
NotFound48620 小时前
实战指南如何实现Java Web 拦截机制:Filter 与 Interceptor 深度分享
java·开发语言·前端
Dontla20 小时前
高基数(High Cardinality)问题介绍(Prometheus、高基数字段、低基数字段)
前端·数据库·prometheus
whuhewei1 天前
为什么客户端不存在跨域问题
前端·安全
妮妮喔妮1 天前
supabase的webhook报错
开发语言·前端·javascript
冬奇Lab1 天前
Claude Code 实战经验分享(下篇):记忆、规则、权限与快捷操作
人工智能·ai编程
yivifu1 天前
手搓HTML双行夹批效果
前端·html·html双行夹注
奔跑的卡卡1 天前
Web开发与AI融合-第一篇:Web开发与AI融合的时代序幕
前端·人工智能