大模型Qwen2.5 家族的最新成员

阿里今天发布了 Qwen 家族的最新成员:Qwen2.5 ,包括语言模型 Qwen2.5 ,以及专门针对编程的 Qwen2.5-Coder 和数学的 Qwen2.5-Math模型。

所有开放权重的模型都是稠密的、decoder-only 的语言模型,提供多种不同规模的版本,包括:

  • Qwen2.5: 0.5B, 1.5B, 3B, 7B, 14B, 32B, 以及 72B;
  • Qwen2.5-Coder: 1.5B, 7B, 以及即将推出的 32B;
  • Qwen2.5-Math: 1.5B, 7B, 以及 72B。

除了 3B 和 72B 的版本外,所有的开源模型都采用了 Apache 2.0 License。

Qwen2.5 主要升级内容

  • Qwen2.5 获得了显著更多的知识,在编程能力和数学能力有大幅提升。
  • 在指令执行、生成长文本、理解结构化数据以及生成结构化输出方面有显著改进。
  • 对各种 system prompt 更具适应性,增强了角色扮演实现和聊天机器人的条件设置功能。
  • Qwen2.5-Coder 使即使较小的编程专用模型也能在编程评估基准测试中表现出媲美大型语言模型的竞争力。
  • Qwen2.5-Math 支持 中文 和 英文,并整合了多种推理方法,包括 CoT、PoT 和 TIR

Qwen2.5: 基础模型大派对! | Qwen

相关推荐
wuli_滔滔1 天前
Qwen2.5、Llama 3.1轻量模型本地化部署指南:从环境配置到企业级实战
vllm·ollama·qwen2.5·llama 3.1
core5123 天前
不借助框架实现Text2SQL
sql·mysql·ai·大模型·qwen·text2sql
core5126 天前
LangChain实现Text2SQL
langchain·大模型·qwen·text2sql
七夜zippoe7 天前
基于Qwen2.5-7B-Chat的本地化部署实战——从模型原理到企业级应用
vllm·ollama·qwen2.5·gradio web·企业级api
武子康10 天前
AI研究-129 Qwen2.5-Omni-7B 要点:显存、上下文、并发与成本
人工智能·深度学习·机器学习·ai·大模型·qwen·全模态
菠菠萝宝10 天前
【Java手搓RAGFlow】-3- 用户认证与权限管理
java·开发语言·人工智能·llm·openai·qwen·rag
宁渡AI大模型12 天前
从生成内容角度介绍开源AI大模型
人工智能·ai·大模型·qwen
温暖名字12 天前
调用qwen3-omni的api对本地文件生成视频文本描述(批量生成)
python·音视频·qwen·qa问答
beckyye1 个月前
给web增加简单的ai对话功能
前端·ai·通义千问·qwen
DO_Community1 个月前
普通服务器都能跑:深入了解 Qwen3-Next-80B-A3B-Instruct
人工智能·开源·llm·大语言模型·qwen