大模型Qwen2.5 家族的最新成员

阿里今天发布了 Qwen 家族的最新成员:Qwen2.5 ,包括语言模型 Qwen2.5 ,以及专门针对编程的 Qwen2.5-Coder 和数学的 Qwen2.5-Math模型。

所有开放权重的模型都是稠密的、decoder-only 的语言模型,提供多种不同规模的版本,包括:

  • Qwen2.5: 0.5B, 1.5B, 3B, 7B, 14B, 32B, 以及 72B;
  • Qwen2.5-Coder: 1.5B, 7B, 以及即将推出的 32B;
  • Qwen2.5-Math: 1.5B, 7B, 以及 72B。

除了 3B 和 72B 的版本外,所有的开源模型都采用了 Apache 2.0 License。

Qwen2.5 主要升级内容

  • Qwen2.5 获得了显著更多的知识,在编程能力和数学能力有大幅提升。
  • 在指令执行、生成长文本、理解结构化数据以及生成结构化输出方面有显著改进。
  • 对各种 system prompt 更具适应性,增强了角色扮演实现和聊天机器人的条件设置功能。
  • Qwen2.5-Coder 使即使较小的编程专用模型也能在编程评估基准测试中表现出媲美大型语言模型的竞争力。
  • Qwen2.5-Math 支持 中文 和 英文,并整合了多种推理方法,包括 CoT、PoT 和 TIR

Qwen2.5: 基础模型大派对! | Qwen

相关推荐
大模型之路5 天前
DeepSeek-R1 如何通过知识蒸馏将推理能力传递给 Qwen
人工智能·知识蒸馏·qwen·deepseek·deepseek-r1
uncle_ll8 天前
基于 llama-index与Qwen大模型实现RAG
大模型·llm·llama·qwen·rag
relis17 天前
编程AI深度实战:大模型哪个好? Mistral vs Qwen vs Deepseek vs Llama
人工智能·llama·qwen·ai大模型·开源模型·deepseek·codestral
__如果1 个月前
论文阅读--Qwen2&2.5技术报告
论文阅读·qwen
OpenSani2 个月前
qwenvl 以及qwenvl 2 模型架构理解
语言模型·qwen·qwen2·qwenvl
Heartsuit2 个月前
LLM大语言模型私有化部署-使用Dify的工作流编排打造专属AI搜索引擎
人工智能·dify·ollama·qwen2.5·ai搜索引擎·tavily search·工作流编排
lzl20402 个月前
【深度学习总结】使用PDF构建RAG:结合Langchain和通义千问
深度学习·langchain·通义千问·qwen·rag
MatpyMaster2 个月前
大模型QLoRA微调——基于Qwen2-7B的自动化病历摘要生成系统
人工智能·大模型·qwen·量化微调
李好秀2 个月前
大语言模型
python·ai·llm·qwen
农夫山泉2号2 个月前
【OCR】——端到端文字识别GOT-OCR2.0不香嘛?
ocr·qwen·got-ocr