刚刚，阿里开源Qwen3-Coder，Claude级别编程模型

机器之心2025-07-23 11:09

阿里开源，又开始卷起来了！

刚刚，阿里发布了 Qwen3-Coder，这次直接在编程能力上登顶全球开源模型，更厉害的是还超越了 GPT-4.1 这种闭源模型，能和 Claude 4 这个目前最强的编程模型平起平坐。

最让人兴奋的是它的实际效果 ------ 据说新手程序员用它一天就能完成资深程序员一周的工作量，生成一个品牌官网最快只需要 5 分钟。这效率简直颠覆认知。

从技术角度看也很有意思，这是千问系列首个采用混合专家 MoE 架构的代码模型，总参数达到 480B 但只激活 35B 参数，原生支持 256K token 上下文，还能扩展到 1M 长度。它用 7.5T 数据预训练，其中 70% 都是代码，难怪编程能力这么强悍。

Agent 能力方面的表现更是亮眼。在 WebArena（浏览器调用）和 BFCL（工具调用）这些 Agent 评测中，Qwen3-Coder 直接刷新了开源模型记录，甚至超越了 GPT-4.1。在 SWE-Bench 这个考察模型自主解决编程任务的评测里，也拿到了开源最佳成绩，能媲美 Claude 4 的水平。

最实用的还是它解决复杂长任务的能力，能够统筹全局自主规划，调用各种工具深入研究问题。实测显示它能调用的工具数量比 Claude 多好几倍，效果相当出色。业内已经有人说开源的 Qwen3-Coder 可能要取代昂贵的 Claude，成为 Agent 领域最受欢迎的编程模型。

目前，它已经在魔搭社区、HuggingFace 等平台开源了，全球开发者都能免费使用。很快还会接入通义灵码，API 也上线了阿里云百炼。

阿里还专门开源了命令行工具 Qwen Code，能更好发挥代理式编程的潜力。而且 API 可以和 Claude Code、Cline 这些工具协同使用。

一直以来，Claude 都是编程大模型领域的天花板。此次阿里开源这种级别的编程模型，你怎么看？欢迎已经用上的同学们评论。