大模型Qwen2.5 家族的最新成员

阿里今天发布了 Qwen 家族的最新成员:Qwen2.5 ,包括语言模型 Qwen2.5 ,以及专门针对编程的 Qwen2.5-Coder 和数学的 Qwen2.5-Math模型。

所有开放权重的模型都是稠密的、decoder-only 的语言模型,提供多种不同规模的版本,包括:

  • Qwen2.5: 0.5B, 1.5B, 3B, 7B, 14B, 32B, 以及 72B;
  • Qwen2.5-Coder: 1.5B, 7B, 以及即将推出的 32B;
  • Qwen2.5-Math: 1.5B, 7B, 以及 72B。

除了 3B 和 72B 的版本外,所有的开源模型都采用了 Apache 2.0 License。

Qwen2.5 主要升级内容

  • Qwen2.5 获得了显著更多的知识,在编程能力和数学能力有大幅提升。
  • 在指令执行、生成长文本、理解结构化数据以及生成结构化输出方面有显著改进。
  • 对各种 system prompt 更具适应性,增强了角色扮演实现和聊天机器人的条件设置功能。
  • Qwen2.5-Coder 使即使较小的编程专用模型也能在编程评估基准测试中表现出媲美大型语言模型的竞争力。
  • Qwen2.5-Math 支持 中文 和 英文,并整合了多种推理方法,包括 CoT、PoT 和 TIR

Qwen2.5: 基础模型大派对! | Qwen

相关推荐
minhuan5 天前
构建AI智能体:二十、妙笔生花:Gradio集成DashScope Qwen-Image模型实现文生图
人工智能·prompt·qwen·gradio·千问大模型
迪菲赫尔曼11 天前
大模型入门实战 | 基于 YOLO 数据集微调 Qwen2.5-VL-3B-Instruct 的目标检测任务
人工智能·yolo·目标检测·大模型·微调·新手入门·qwen2.5
charlee4422 天前
在本地部署Qwen大语言模型全过程总结
大模型·cuda·qwen·量化
Jeremy_lf25 天前
阿里巴巴开源多模态大模型-Qwen-VL系列论文精读(一)
大模型·qwen·多模态大模型·mllm
带电的小王1 个月前
Windows中使用Qwen模型:VSCode+Cline
ide·vscode·ai编程·qwen
张成AI1 个月前
Qwen3-30B-A3B-Thinking-2507 推理模型深度评测
人工智能·qwen
萌主墩墩1 个月前
趣玩-Ollama-Llm-Chatrbot
llm·qwen·ollama·deepseek
诸神缄默不语3 个月前
Re 82:读论文:qwen 3
llm·qwen·阿里·千问·qwen3
西西弗Sisyphus3 个月前
Qwen2.5-VL - FFN(前馈神经网络)Feedforward Neural Network
人工智能·深度学习·神经网络·qwen
AIGC_北苏3 个月前
Windows安装Docker部署dify,接入阿里云api-key进行rag测试
docker·容器·qwen·dify