ApiSmart x Qwen2.5-Coder 开源旗舰编程模型媲美 GPT-4o, ApiSmart 实测!

通义千问代码模型开源版。Qwen2.5-Coder相比CodeQwen1.5有了实质性的改进。Qwen2.5-Coder在包含5.5万亿Token的编程相关数据上进行了训练,使即使较小的编程专用模型也能在编程评估基准测试中表现出媲美大型语言模型的竞争力。

阿里云-2024年11月12日

Qwen2.5-Coder

「强大」、「多样」、「实用」的 Qwen2.5-Coder 全系列模型,致力于持续推动 Open CodeLLMs 的发展。

  • 强大:Qwen2.5-Coder-32B-Instruct 成为目前 SOTA 的开源代码模型,代码能力追平 GPT-4o,展现出强大且全面的代码能力,同时具备良好的通用和数学能力。

  • 多样:上个月我们开源了 1.5B、7B 两个尺寸,本次开源又带来 0.5B、3B、14B、32B 四个尺寸,截至目前, Qwen2.5-Coder 已经覆盖了主流的六个模型尺寸,以满足不同开发者的需要。

  • 实用:我们探索了 Qwen2.5-Coder 在代码助手和 Artifacts 两种场景下的实用性,并用一些样例来展示 Qwen2.5-Coder 在实际场景中的应用潜力。

ApiSmart 测评

参考官方有更多的测试数据对比;下面看看在 ApiSmart 里的测评效果:

  1. 申请阿里云百炼 api key : https://help.aliyun.com/zh/model-studio/getting-started/first-api-call-to-qwen 申请步骤

  2. 打开 ApiSmart 配置 Tonyi

  3. 选择或者输入模型,开始对话; https://help.aliyun.com/zh/model-studio/getting-started/models#ca55352461kzq 模型列表

单纯解释代码这块确实和 GPT-4o, 不相上下,不知道其他功能是否一样,比如写代码,和测试用例?你不防实验下看看!

Refer

  1. https://help.aliyun.com/zh/model-studio/getting-started/models#ca55352461kzq

  2. https://qwenlm.github.io/zh/blog/qwen2.5-coder-family/

ApiHug - API design Copilot - IntelliJ IDEs Plugin | Marketplacehttps://plugins.jetbrains.com/plugin/23534-apihug--api-design-copilot

ApiHug - API Design & Develop New Paradigm.ApiHug - API Design & Develop New Paradigm.https://apihug.com/

有有趣的 prompt 小伙伴也可慷慨分享给大家,会汇总到github(原文链接内文章):

GitHub - apihug/apismart-prompts: awesome prompts you can used for programing espicially in apismart pluginawesome prompts you can used for programing espicially in apismart plugin - apihug/apismart-promptshttps://github.com/apihug/apismart-prompts/

ApiSmart 配置 - ApiHugApiSmart 配置和支持的LLM供应商https://apihug.com/zhCN-docs/copilot/001_settings#prompt

相关推荐
tuan_zhang29 分钟前
第17章 安全培训筑牢梦想根基
人工智能·安全·工业软件·太空探索·战略欺骗·算法攻坚
qw94932 分钟前
Spring 6 第6章——单元测试:Junit
spring·junit·单元测试
Antonio9151 小时前
【opencv】第10章 角点检测
人工智能·opencv·计算机视觉
互联网资讯1 小时前
详解共享WiFi小程序怎么弄!
大数据·运维·网络·人工智能·小程序·生活
Leaf吧1 小时前
springboot 配置多数据源以及动态切换数据源
java·数据库·spring boot·后端
helianying551 小时前
AI赋能零售:ScriptEcho如何提升效率,优化用户体验
前端·人工智能·ux·零售
荆州克莱2 小时前
Golang的网络编程安全
spring boot·spring·spring cloud·css3·技术
积鼎科技-多相流在线2 小时前
探索国产多相流仿真技术应用,积鼎科技助力石油化工工程数字化交付
人工智能·科技·cfd·流体仿真·多相流·virtualflow
XianxinMao2 小时前
开源AI崛起:新模型逼近商业巨头
人工智能·开源
格砸2 小时前
Trae使用体验,未来已至?
人工智能·openai·trae