刚刚,阿里开源Qwen3-Coder,Claude级别编程模型

阿里开源,又开始卷起来了!

刚刚,阿里发布了 Qwen3-Coder,这次直接在编程能力上登顶全球开源模型,更厉害的是还超越了 GPT-4.1 这种闭源模型,能和 Claude 4 这个目前最强的编程模型平起平坐。

最让人兴奋的是它的实际效果 ------ 据说新手程序员用它一天就能完成资深程序员一周的工作量,生成一个品牌官网最快只需要 5 分钟。这效率简直颠覆认知。

从技术角度看也很有意思,这是千问系列首个采用混合专家 MoE 架构的代码模型,总参数达到 480B 但只激活 35B 参数,原生支持 256K token 上下文,还能扩展到 1M 长度。它用 7.5T 数据预训练,其中 70% 都是代码,难怪编程能力这么强悍。

Agent 能力方面的表现更是亮眼。在 WebArena(浏览器调用)和 BFCL(工具调用)这些 Agent 评测中,Qwen3-Coder 直接刷新了开源模型记录,甚至超越了 GPT-4.1。在 SWE-Bench 这个考察模型自主解决编程任务的评测里,也拿到了开源最佳成绩,能媲美 Claude 4 的水平。

最实用的还是它解决复杂长任务的能力,能够统筹全局自主规划,调用各种工具深入研究问题。实测显示它能调用的工具数量比 Claude 多好几倍,效果相当出色。业内已经有人说开源的 Qwen3-Coder 可能要取代昂贵的 Claude,成为 Agent 领域最受欢迎的编程模型。

目前,它已经在魔搭社区、HuggingFace 等平台开源了,全球开发者都能免费使用。很快还会接入通义灵码,API 也上线了阿里云百炼。

阿里还专门开源了命令行工具 Qwen Code,能更好发挥代理式编程的潜力。而且 API 可以和 Claude Code、Cline 这些工具协同使用。

一直以来,Claude 都是编程大模型领域的天花板。此次阿里开源这种级别的编程模型,你怎么看?欢迎已经用上的同学们评论。

相关推荐
win4r12 小时前
MiniMax M3 深度体验:这可能是国产模型里最接近“全能工程师”的一次
aigc·ai编程·claude
序列未来18 小时前
Claude Prompt 六大进阶技巧全实战:Effort 控制 / Few-Shot / CoT / Cache / 双层护栏
claude
序列未来18 小时前
MCP 企业级集成全指南:从协议原理到 OAuth 2.1 安全配置四层体系
claude
序列未来18 小时前
RAG vs 长上下文:企业场景完整决策框架,混合检索 +17% 召回率实战
claude
Ztopcloud极拓云视角21 小时前
Claude Opus 4.8 实战接入指南:动态工作流 + 思考投入控制深度使用
大数据·人工智能·gpt·claude·deepseek
Resistance丶未来1 天前
魔芋 AI 企业级大模型落地实战指南
人工智能·api·claude·gemini·deepseek·魔芋ai·魔芋api
小碗细面1 天前
35K Star 一夜爆火:CodeGraph 把 AI 编码 Agent 的 Token 砍掉 57%,工具调用减少 62%
ai编程·claude
拾年2751 天前
一个月更 30 个版本!Claude Code 5 月核心更新,效率直接拉满
人工智能·ai编程·claude
沉默王二1 天前
同事惊呆了:“Codex我也在用,但你AGENTS.md写了2000行,是把它当Prompt还是当Readme?”
agent·ai编程·claude
白狐_7981 天前
Claude Code 接入 Kimi K2.5 完整教程:使用 Moonshot Anthropic 兼容接口替换默认 Claude 模型
claude