ApiSmart x Qwen2.5-Coder 开源旗舰编程模型媲美 GPT-4o, ApiSmart 实测!

通义千问代码模型开源版。Qwen2.5-Coder相比CodeQwen1.5有了实质性的改进。Qwen2.5-Coder在包含5.5万亿Token的编程相关数据上进行了训练,使即使较小的编程专用模型也能在编程评估基准测试中表现出媲美大型语言模型的竞争力。

阿里云-2024年11月12日

Qwen2.5-Coder

「强大」、「多样」、「实用」的 Qwen2.5-Coder 全系列模型,致力于持续推动 Open CodeLLMs 的发展。

  • 强大:Qwen2.5-Coder-32B-Instruct 成为目前 SOTA 的开源代码模型,代码能力追平 GPT-4o,展现出强大且全面的代码能力,同时具备良好的通用和数学能力。

  • 多样:上个月我们开源了 1.5B、7B 两个尺寸,本次开源又带来 0.5B、3B、14B、32B 四个尺寸,截至目前, Qwen2.5-Coder 已经覆盖了主流的六个模型尺寸,以满足不同开发者的需要。

  • 实用:我们探索了 Qwen2.5-Coder 在代码助手和 Artifacts 两种场景下的实用性,并用一些样例来展示 Qwen2.5-Coder 在实际场景中的应用潜力。

ApiSmart 测评

参考官方有更多的测试数据对比;下面看看在 ApiSmart 里的测评效果:

  1. 申请阿里云百炼 api key : https://help.aliyun.com/zh/model-studio/getting-started/first-api-call-to-qwen 申请步骤

  2. 打开 ApiSmart 配置 Tonyi

  3. 选择或者输入模型,开始对话; https://help.aliyun.com/zh/model-studio/getting-started/models#ca55352461kzq 模型列表

单纯解释代码这块确实和 GPT-4o, 不相上下,不知道其他功能是否一样,比如写代码,和测试用例?你不防实验下看看!

Refer

  1. https://help.aliyun.com/zh/model-studio/getting-started/models#ca55352461kzq

  2. https://qwenlm.github.io/zh/blog/qwen2.5-coder-family/

ApiHug - API design Copilot - IntelliJ IDEs Plugin | Marketplacehttps://plugins.jetbrains.com/plugin/23534-apihug--api-design-copilot

ApiHug - API Design & Develop New Paradigm.ApiHug - API Design & Develop New Paradigm.https://apihug.com/

有有趣的 prompt 小伙伴也可慷慨分享给大家,会汇总到github(原文链接内文章):

GitHub - apihug/apismart-prompts: awesome prompts you can used for programing espicially in apismart pluginawesome prompts you can used for programing espicially in apismart plugin - apihug/apismart-promptshttps://github.com/apihug/apismart-prompts/

ApiSmart 配置 - ApiHugApiSmart 配置和支持的LLM供应商https://apihug.com/zhCN-docs/copilot/001_settings#prompt

相关推荐
老金带你玩AI几秒前
Claude Code自动记忆来了!配合老金三层记忆系统全开源!加强Plus!
人工智能
Halo咯咯4 分钟前
无限免费 OpenClaw:接入本地模型后,你的 AI Agent 就可以 24 小时自动干活(Mac Mini 可用)
人工智能
洋洋技术笔记27 分钟前
Spring Boot条件注解详解
java·spring boot
王小酱11 小时前
Claude Code 创始人 Boris 揭秘:团队 10 倍效率技巧
openai·ai编程·aiops
小兵张健12 小时前
最低成本使用最强模型编程方案
ai编程
NAGNIP12 小时前
一文搞懂深度学习中的通用逼近定理!
人工智能·算法·面试
冬奇Lab13 小时前
一天一个开源项目(第36篇):EverMemOS - 跨 LLM 与平台的长时记忆 OS,让 Agent 会记忆更会推理
人工智能·开源·资讯
冬奇Lab13 小时前
OpenClaw 源码深度解析(一):Gateway——为什么需要一个"中枢"
人工智能·开源·源码阅读
王小酱13 小时前
结合OpenSpec 与 Everything-Claude-Code (ECC) 的构建团队工作流程
openai·ai编程·aiops
小兵张健14 小时前
AI 时代的软件开发流程:先把页面跑起来,再谈后端
ai编程