阿里开源编程大模型 CodeQwen1.5:64K&92编程语言,Code和SQL编程,评测接近GPT-4-Turbo

前言

阿里巴巴最近发布的CodeQwen1.5模型标志着其在编程语言模型领域的一次重大突破。这款开源模型不仅支持高达92种编程语言和64K的上下文长度,而且在多项性能评测中显示出接近或超过当前行业领导者GPT-4-Turbo的能力。

模型概述

CodeQwen1.5是基于Qwen语言模型的进阶版本,拥有70亿参数,并使用GQA架构。模型在约3万亿token的代码相关数据上进行了预训练,这使得它在代码生成、长序列建模、代码修改和SQL编程等多个方面表现卓越。

编程语言支持

模型支持的92种编程语言覆盖了从Python、Java、C++到较少见的语言如Elixir和Go,使其成为多语言编程环境中的强大工具。这种广泛的语言支持对于开发多平台应用程序尤为重要,能够满足不同开发者的需求。

长序列建模能力

CodeQwen1.5的一个重要特点是其长序列建模能力,能处理高达64K的上下文输入。这对于理解大型代码库和执行复杂的代码重构任务至关重要。模型在处理长序列时展现了极低的困惑度,表明其对代码结构和语义的深入理解。

SQL编程专长

除了通用编程能力,CodeQwen1.5还展现了出色的SQL编程专长,能够通过自然语言查询实现复杂的数据库操作。这一功能特别适合非技术用户,帮助他们轻松地进行数据检索和管理。在两个流行的文本到SQL基准测试Spider和Bird上评估了CodeQwen1.5-Chat的性能。实验结果显示,CodeQwen1.5在接近GPT-4的位置排名第二(结果来自DIN-SQL,一种 SOTA 的提示方法)。

性能评测

在标准的编程能力评测如HumanEval和MBPP中,CodeQwen1.5的表现堪比顶级商业模型。例如,在HumanEval的0-shot测试中,CodeQwen1.5的得分高达51.8%,而在MBPP的3-shot测试中,得分达到61.8%。这些成绩显示了其在理解和执行复杂编程任务方面的能力。

CodeQwen1.5不仅在 Python 方面表现出色,还是一个多编程语言的编程模型。在 MultiPL-E 平台上,包括 Python、C++、Java、PHP、TypeScript、C#、Bash 和 JavaScript 在内的 8 种主流语言上进行了全面评估,这些结果证明了CodeQwen1.5强大的编程能力。

结论

CodeQwen1.5的发布不仅证明了阿里巴巴在开源社区中的影响力,也标志着开源编程模型在性能和通用性上达到了一个新的高度。它不仅为开发者社区提供了一个强大的工具,还为编程语言模型的未来发展设定了新的标准。随着更多的开源项目和开发者参与到CodeQwen1.5的持续改进中,我们可以期待这一模型在未来解决更多复杂的软件开发挑战。

模型下载

Huggingface模型下载

https://huggingface.co/Qwen/CodeQwen1.5-7B

AI快站模型免费加速下载

https://aifasthub.com/models/Qwen

相关推荐
StarPrayers.6 分钟前
Binary Classification& sigmoid 函数的逻辑回归&Decision Boundary
人工智能·分类·数据挖掘
紫金桥软件10 分钟前
组态软件和实时数据库区别大吗?
数据库·物联网·软件工程·scada·监控组态软件
渡我白衣11 分钟前
C++:链接的两难 —— ODR中的强与弱符号机制
开发语言·c++·人工智能·深度学习·网络协议·算法·机器学习
大模型真好玩13 分钟前
LangChain1.0速通指南(一)——LangChain1.0核心升级
人工智能·agent·mcp
私人珍藏库15 分钟前
Parallels Desktop 26.1.1 for Mac 秋叶QiuChenly中文解锁直装版,最好用的macOS虚拟机
人工智能
程序员大雄学编程32 分钟前
用Python来学微积分23-微分中值定理
人工智能·python·数学·微积分
GMICLOUD34 分钟前
网易科技专访 GMI Cloud 创始人&CEO Alex Yeh:以“产品+布局+服务”构建全球竞争力
人工智能·科技·ai·gpu算力·agi·ai应用·ai基础设施
wwlsm_zql39 分钟前
石头科技专利创新:清洁机器人维护简化,效率升级
人工智能·科技·microsoft·机器人
luoganttcc42 分钟前
加快高水平科技自立自强,引领发展新质生产力 <十五五 规划节选>
大数据·人工智能·科技
夕阳染色的坡道1 小时前
LineSlam线特征投影融合(Fuse) 中pML->GetLineNormalVector()的理解代码理解
人工智能·opencv·计算机视觉