刚刚,阿里开源Qwen3-Coder,Claude级别编程模型

阿里开源,又开始卷起来了!

刚刚,阿里发布了 Qwen3-Coder,这次直接在编程能力上登顶全球开源模型,更厉害的是还超越了 GPT-4.1 这种闭源模型,能和 Claude 4 这个目前最强的编程模型平起平坐。

最让人兴奋的是它的实际效果 ------ 据说新手程序员用它一天就能完成资深程序员一周的工作量,生成一个品牌官网最快只需要 5 分钟。这效率简直颠覆认知。

从技术角度看也很有意思,这是千问系列首个采用混合专家 MoE 架构的代码模型,总参数达到 480B 但只激活 35B 参数,原生支持 256K token 上下文,还能扩展到 1M 长度。它用 7.5T 数据预训练,其中 70% 都是代码,难怪编程能力这么强悍。

Agent 能力方面的表现更是亮眼。在 WebArena(浏览器调用)和 BFCL(工具调用)这些 Agent 评测中,Qwen3-Coder 直接刷新了开源模型记录,甚至超越了 GPT-4.1。在 SWE-Bench 这个考察模型自主解决编程任务的评测里,也拿到了开源最佳成绩,能媲美 Claude 4 的水平。

最实用的还是它解决复杂长任务的能力,能够统筹全局自主规划,调用各种工具深入研究问题。实测显示它能调用的工具数量比 Claude 多好几倍,效果相当出色。业内已经有人说开源的 Qwen3-Coder 可能要取代昂贵的 Claude,成为 Agent 领域最受欢迎的编程模型。

目前,它已经在魔搭社区、HuggingFace 等平台开源了,全球开发者都能免费使用。很快还会接入通义灵码,API 也上线了阿里云百炼。

阿里还专门开源了命令行工具 Qwen Code,能更好发挥代理式编程的潜力。而且 API 可以和 Claude Code、Cline 这些工具协同使用。

一直以来,Claude 都是编程大模型领域的天花板。此次阿里开源这种级别的编程模型,你怎么看?欢迎已经用上的同学们评论。

相关推荐
武子康14 分钟前
调查研究-208 OpenAI GPT-5.6 Sol / Terra / Luna 解读:AI 模型竞争正在从“更聪明“转向“能长期干活“
人工智能·openai·claude
武子康27 分钟前
调查研究-207 Claude Sonnet 5 发布:Agent 能力下放后,模型路由要从“强弱分层“改成“执行分层“
人工智能·agent·claude
kyriewen12 小时前
Anthropic 估值逼近万亿美元,Claude Sonnet 5 + Claude Science 一天两连发
前端·ai编程·claude
ServBay17 小时前
7 个AI开发中真正用得上的 MCP Server,配合Claude Code食用效果更佳
后端·claude·mcp
小七-七牛开发者20 小时前
Coding Agent 规则管理:CLAUDE.md、Skills、Hooks、Subagents 到底怎么选?
ai·大模型·agent·claude·token·loop·mcp·claudecode·ai coding
Flynt1 天前
配置Chrome DevTools MCP,我在Windows上折腾了两个晚上
ai编程·claude·mcp
想要成为糕糕手1 天前
Harness Engineering:大模型时代的“马鞍”——从记忆层开始,让AI真正为你所用
面试·ai编程·claude
Lsx_2 天前
不只是 Prompt:用 Superpowers Skill 给 AI 编程装上工程化工作流
前端·ai编程·claude
i晟2 天前
Claude对话机制深度解析:为什么 Claude Code 和你越聊越懂你?每句对话都要读一整个上下文吗?
agent·claude