大模型Qwen2.5 家族的最新成员

阿里今天发布了 Qwen 家族的最新成员:Qwen2.5 ,包括语言模型 Qwen2.5 ,以及专门针对编程的 Qwen2.5-Coder 和数学的 Qwen2.5-Math模型。

所有开放权重的模型都是稠密的、decoder-only 的语言模型,提供多种不同规模的版本,包括:

  • Qwen2.5: 0.5B, 1.5B, 3B, 7B, 14B, 32B, 以及 72B;
  • Qwen2.5-Coder: 1.5B, 7B, 以及即将推出的 32B;
  • Qwen2.5-Math: 1.5B, 7B, 以及 72B。

除了 3B 和 72B 的版本外,所有的开源模型都采用了 Apache 2.0 License。

Qwen2.5 主要升级内容

  • Qwen2.5 获得了显著更多的知识,在编程能力和数学能力有大幅提升。
  • 在指令执行、生成长文本、理解结构化数据以及生成结构化输出方面有显著改进。
  • 对各种 system prompt 更具适应性,增强了角色扮演实现和聊天机器人的条件设置功能。
  • Qwen2.5-Coder 使即使较小的编程专用模型也能在编程评估基准测试中表现出媲美大型语言模型的竞争力。
  • Qwen2.5-Math 支持 中文 和 英文,并整合了多种推理方法,包括 CoT、PoT 和 TIR

Qwen2.5: 基础模型大派对! | Qwen

相关推荐
loong_XL7 天前
qwen3.5 文字、图像、视频多模态openai接口案例
音视频·qwen·多模态大模型
重生之我要成为代码大佬9 天前
AI框架设计与选型
人工智能·langchain·大模型·llama·qwen
XLYcmy11 天前
智能体大赛 总结与展望 比赛总结
大数据·ai·llm·prompt·agent·qwen·万方数据库
背离赤道逆光而行12 天前
Clawdbot部署实操:解决‘gateway token missing’授权问题的完整步骤
大语言模型·qwen·api网关·clawdbot
leniou的牙膏12 天前
Clawdbot部署教程:解决‘gateway token missing’授权问题的完整步骤
大语言模型·qwen·api网关·文本交互
XLYcmy16 天前
智能体大赛 技术架构 核心驱动层
人工智能·算法·机器学习·llm·prompt·agent·qwen
laplace012318 天前
KL 散度1
人工智能·算法·agent·qwen
laplace012318 天前
浮点数精度
人工智能·算法·agent·qwen
dawdo22221 天前
自己动手从头开始编写LLM推理引擎(11)-xLLM的benchmark实现
llm·transformer·性能测试·qwen·benchmark·推理引擎
x-cmd21 天前
[x-cmd] 阿里发布 Qwen-Image-2.0,实测复杂插画生成,手绘细节还原度很高!
ai·qwen·阿里·x-cmd·插画·qwen-image