大模型Qwen2.5 家族的最新成员

阿里今天发布了 Qwen 家族的最新成员:Qwen2.5 ,包括语言模型 Qwen2.5 ,以及专门针对编程的 Qwen2.5-Coder 和数学的 Qwen2.5-Math模型。

所有开放权重的模型都是稠密的、decoder-only 的语言模型,提供多种不同规模的版本,包括:

  • Qwen2.5: 0.5B, 1.5B, 3B, 7B, 14B, 32B, 以及 72B;
  • Qwen2.5-Coder: 1.5B, 7B, 以及即将推出的 32B;
  • Qwen2.5-Math: 1.5B, 7B, 以及 72B。

除了 3B 和 72B 的版本外,所有的开源模型都采用了 Apache 2.0 License。

Qwen2.5 主要升级内容

  • Qwen2.5 获得了显著更多的知识,在编程能力和数学能力有大幅提升。
  • 在指令执行、生成长文本、理解结构化数据以及生成结构化输出方面有显著改进。
  • 对各种 system prompt 更具适应性,增强了角色扮演实现和聊天机器人的条件设置功能。
  • Qwen2.5-Coder 使即使较小的编程专用模型也能在编程评估基准测试中表现出媲美大型语言模型的竞争力。
  • Qwen2.5-Math 支持 中文 和 英文,并整合了多种推理方法,包括 CoT、PoT 和 TIR

Qwen2.5: 基础模型大派对! | Qwen

相关推荐
仙魁XAN11 天前
AGI 之 【Dify】 之 Dify 在 Windows 端本地部署调用 Ollama 本地下载的大模型,实现 API 形式进行聊天对话
api·qwen·dify·1024程序员节·ollama
一路追寻21 天前
使用Ollama测试OpenAI的Swarm多智能体编排框架
llm·openai·agent·swarm·ollama·qwen2.5
yingchenwy1 个月前
Qwen2.5 模型使用初体验
linux·qwen2.5
伊织code2 个月前
AudioNotes -将音频内容转 markdown
音频·markdown·提取·qwen·tts·funasr·audionotes
洛阳泰山3 个月前
使用Chainlit接入通义千问快速实现一个自然语言转sql语言的智能体
前端·python·sql·openai·qwen·chainlit
洛阳泰山3 个月前
使用Chainlit接入通义千问快速实现一个本地文档知识问答机器人增强版
langchain·机器人·llm·qwen·rag·chainlit
EEE1even4 个月前
Qwen2本地web Demo
前端·语言模型·llm·qwen
我在北国不背锅5 个月前
内网环境使用Docker部署Qwen2模型
docker·容器·qwen
m0_375599735 个月前
阿里通义千问:本地部署Qwen1.5开源大模型
大语言模型·通义千问·qwen