阿里开源最强编程模型Qwen3-Coder!超越GPT-4.1,登顶开源榜首

4800亿参数激活参数35B,阿里刚刚开源的编程模型在SWE-Bench编程任务自主规划评测中刷新AI编程SOTA,甚至超越闭源巨头,成为最强开源编程模型。

刚刚,阿里开源了全新的通义千问AI 编程大模型 Qwen3-Coder 。一经推出,就成功登顶全球开源模型阵营,甚至超越了GPT4.1 等闭源模型,直接对标全球最强编程模型 Claude4,尤其是在与 Claude Sonnet 4 的较量中,展现出了强大的优势。

Qwen3-Coder 作为千问系列模型中首个采用混合专家 MoE 架构的代码模型,以480B参数激活 35B 参数,原生支持 256K token 的上下文,并且可扩展至 1M 长度。

在训练数据方面,它在代码占比 70% 的 7.5T 数据上进行预训练,随后在后训练阶段针对编程任务及智能体任务开展强化学习,这使得它在通用能力、代码能力及智能体(Agent)能力上都实现了巨大飞跃。

为了方便开发者更好地运用 Qwen3-Coder,团队还开源了一款命令行工具 Qwen Code,该工具能够充分挖掘 Qwen3-Coder 在代理式编程上的潜力。

总的来说,技术突破集中在三个维度:

  • 长文本处理能力:原生支持256K上下文,通过YaRN技术扩展至1M输入长度,可完整解析大型代码仓库或科研论文;

  • 训练数据革新:基于7.5T token训练数据集(代码占比70%),结合强化学习优化代码执行成功率,显著提升复杂任务解决能力;

  • 工具协同生态:同步开源的Qwen Code命令行工具适配Claude Code等协议,支持多工具链协同工作。

在关键的能力评测中,Qwen3-Coder 在浏览器调用(WebArena)、工具调用(BFCL)等智能体能力评测里,刷新了开源模型纪录,成功超越 GPT4.1 。

而在考察模型自主规划解决编程任务的 SWE-Bench 评测中,Qwen3-Coder 取得了开源最佳效果,达到了可与 Claude4 媲美的程度。Claude Sonnet 4 此前在编程模型领域也有着不错的口碑,但其在面对 Qwen3-Coder 时,还是稍显逊色 。

从官方发布的部分示例来看,Qwen3-Coder在多个编程领域表现出较高的完成度。

示例1:用Qwen3-Code模拟烟囱拆除

示例2:生成效果逼真的可视化3D地球

示例3:模拟太阳系行星运转动态图

目前,Qwen3-Coder 已在魔搭社区、HuggingFace 等平台开源,全球开发者都能够免费下载使用 。并且,它很快将接入阿里的 AI 编程产品通义灵码,API 也已上线阿里云百炼。

此次开源标志着国产编程模型在Agent任务领域达到全球顶尖水平。而随着通义灵码等产品即将集成新模型,编程效率革命已进入实质落地阶段。

点击www.suanjiayun.com,了解更多

相关推荐
文心快码 Baidu Comate1 小时前
您的前端开发智能工作流待升级,查收最新 Figma2Code!
人工智能·ai编程·文心快码·ai ide·comate ai ide
云起SAAS2 小时前
养成合成小游戏抖音快手微信小程序看广告流量主开源
微信小程序·小程序·ai编程·看广告变现轻·养成合成小游戏
AIminminHu2 小时前
实战项目(十二:《AI画质增强与LED驱动控制:一场关于‘创造’与‘还原’的对话》):从LED冬奥会、奥运会及春晚等大屏,到手机小屏,快来挖一挖里面都有什么
人工智能·智能手机
skywalk81633 小时前
在Windows10 Edge浏览器里安装DeepSider大模型插件来免费使用gpt-4o、NanoBanana等AI大模型
人工智能
汽车仪器仪表相关领域3 小时前
工业安全新利器:NHQT-4四合一检测线系统深度解析
网络·数据库·人工智能·安全·汽车·检测站·汽车检测
有Li3 小时前
基于神经控制微分方程的采集无关深度学习用于定量MRI参数估计|文献速递-文献分享
论文阅读·人工智能·文献·医学生
taxunjishu4 小时前
DeviceNet 转 Profinet:西门子 S7 - 1500 PLC 与欧姆龙伺服电机在汽车焊装生产线夹具快速切换定位的通讯配置案例
人工智能·区块链·工业物联网·工业自动化·profinet·devicenet·总线协议转换网关
飞哥数智坊4 小时前
打造我的 AI 开发团队(一):sub-agent 初探
ai编程·claude
Goboy4 小时前
一文搞定 Qwen3-Coder 接入电脑终端,全流程保姆级教程(附实战演示)
ai编程
脑极体5 小时前
华为,让金融智能体月映千江
人工智能·华为·金融