大模型Qwen2.5 家族的最新成员

ejinxian2024-09-21 14:40

阿里今天发布了 Qwen 家族的最新成员：Qwen2.5 ，包括语言模型 Qwen2.5 ，以及专门针对编程的 Qwen2.5-Coder 和数学的 Qwen2.5-Math模型。

所有开放权重的模型都是稠密的、decoder-only 的语言模型，提供多种不同规模的版本，包括：

Qwen2.5: 0.5B, 1.5B, 3B, 7B, 14B, 32B, 以及 72B;
Qwen2.5-Coder: 1.5B, 7B, 以及即将推出的 32B;
Qwen2.5-Math: 1.5B, 7B, 以及 72B。

除了 3B 和 72B 的版本外，所有的开源模型都采用了 Apache 2.0 License。

Qwen2.5 主要升级内容

Qwen2.5 获得了显著更多的知识，在编程能力和数学能力有大幅提升。
在指令执行、生成长文本、理解结构化数据以及生成结构化输出方面有显著改进。
对各种 system prompt 更具适应性，增强了角色扮演实现和聊天机器人的条件设置功能。
Qwen2.5-Coder 使即使较小的编程专用模型也能在编程评估基准测试中表现出媲美大型语言模型的竞争力。
Qwen2.5-Math 支持中文和英文，并整合了多种推理方法，包括 CoT、PoT 和 TIR

Qwen2.5: 基础模型大派对！ | Qwen

上一篇：ovirt error: Network not found: no network with matching name ‘vdsm-ovirtmgmt‘

下一篇：Python中lambda表达式的使用——完整通透版

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 年 AI 大模型 & AI 编程工具实战全总结 092026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？102026年AI技术突破与产业落地全景：从GPT-5到多模态智能体的新纪元