

阿里开源,又开始卷起来了!
刚刚,阿里发布了 Qwen3-Coder,这次直接在编程能力上登顶全球开源模型,更厉害的是还超越了 GPT-4.1 这种闭源模型,能和 Claude 4 这个目前最强的编程模型平起平坐。
最让人兴奋的是它的实际效果 ------ 据说新手程序员用它一天就能完成资深程序员一周的工作量,生成一个品牌官网最快只需要 5 分钟。这效率简直颠覆认知。
从技术角度看也很有意思,这是千问系列首个采用混合专家 MoE 架构的代码模型,总参数达到 480B 但只激活 35B 参数,原生支持 256K token 上下文,还能扩展到 1M 长度。它用 7.5T 数据预训练,其中 70% 都是代码,难怪编程能力这么强悍。
Agent 能力方面的表现更是亮眼。在 WebArena(浏览器调用)和 BFCL(工具调用)这些 Agent 评测中,Qwen3-Coder 直接刷新了开源模型记录,甚至超越了 GPT-4.1。在 SWE-Bench 这个考察模型自主解决编程任务的评测里,也拿到了开源最佳成绩,能媲美 Claude 4 的水平。
最实用的还是它解决复杂长任务的能力,能够统筹全局自主规划,调用各种工具深入研究问题。实测显示它能调用的工具数量比 Claude 多好几倍,效果相当出色。业内已经有人说开源的 Qwen3-Coder 可能要取代昂贵的 Claude,成为 Agent 领域最受欢迎的编程模型。
目前,它已经在魔搭社区、HuggingFace 等平台开源了,全球开发者都能免费使用。很快还会接入通义灵码,API 也上线了阿里云百炼。
阿里还专门开源了命令行工具 Qwen Code,能更好发挥代理式编程的潜力。而且 API 可以和 Claude Code、Cline 这些工具协同使用。
一直以来,Claude 都是编程大模型领域的天花板。此次阿里开源这种级别的编程模型,你怎么看?欢迎已经用上的同学们评论。