国产开源大模型发布时间线

国产开源大模型发布时间线

本文档按发布时间倒序梳理三大主流国产开源大模型(MiniMax、DeepSeek、Qwen)系列的关键版本,便于横向对比各阵营的技术演进脉络。

数据截至 2026 年 3 月 29 日 · 涵盖 MiniMax、DeepSeek、Qwen 三大开源模型系列


一、MiniMax 模型时间线

魔塔社区:MiniMax @ ModelScope

2026 年

发布时间 模型名称 类别 核心特点
2026-03-18 MiniMax M2.7 文本 / Agent 新一代 Agent 旗舰,首次实现"模型自我进化",可深度参与自身训练与优化,研发场景中可承担 30%--50% 工作量
2026-02-12 MiniMax M2.5 文本 原生 Agent 生产级模型,编程能力显著提升,支持工具调用与搜索,成本优势突出(1 万美元可支持 4 个 Agent 连续工作一年)
2026-01-16 MiniMax Music-2.5 音乐 音乐生成模型升级版,支持纯音乐创作,突破风格边界

2025 年

发布时间 模型名称 类别 核心特点
2025-12-22 MiniMax M2.1 文本 多语言编程专家,专注复杂编程体验与精准代码重构
2025-10-30 MiniMax Music-2.0 音乐 百变唱将,人声灵动,精准乐器控制,支持 5 分钟音乐创作
2025-10-29 MiniMax Speech-2.6 语音 新一代语音模型,极致音质与韵律表现,首包响应时间压缩至 250 ms
2025-10-28 MiniMax Hailuo-2.3 视频 肢体动作、物理表现与指令遵循能力全面升级,支持 Fast 版本
2025-10-27 MiniMax M2 文本 10B 激活参数(总参 230B),专为编码与 Agent 工作流优化,开源后登顶开源模型榜首
2025-09-11 MiniMax Music-1.5 音乐 支持 4 分钟音乐时长,回归"好听"本质
2025-08-06 MiniMax Speech-2.5 语音 支持更多语种,极高相似度声音克隆表现
2025-06-18 MiniMax Hailuo-02 视频 支持 1080P 分辨率及 10 秒视频生成
2025-06-16 MiniMax M1 文本 / 推理 推理模型,80K 思维链 × 1M 上下文输入,效果比肩海外顶尖模型,全球首个开源大规模混合架构推理模型
2025-04-02 Speech-02 系列 语音 超真实人声表现,卓越韵律与稳定性
2025-02-15 Image-01 图像 支持文本描述生成多种尺寸图片
2025-02-11 T2V-01-Director / I2V-01-Director 视频 导演级运镜控制,电影级镜头叙事语言
2025-01-15 Text-01 / VL-01 文本 / 视觉 全新一代文本模型与视觉理解模型

2024 年及更早

发布时间 模型名称 类别 核心特点
2024-08-31 Video Generation API 视频 视频生成接口首次开放
2024-06-27 Music Generation API 音乐 音乐生成接口首次开放
2024-05 abab 6.5s / 6.5 / 5.5 文本 abab 系列主力版本
2024-01 abab 5.5s 文本 abab 系列早期优化版

MiniMax 模型分类汇总

类别 代表模型
🔤 文本模型 M2.7、M2.5、M2.1、M2、M1、Text-01、abab 系列
👁️ 视觉理解 VL-01
🎬 视频生成 Hailuo-2.3、Hailuo-02、T2V / I2V-01-Director
🔊 语音模型 Speech-2.6、Speech-2.5、Speech-02 系列
🎵 音乐模型 Music-2.5、Music-2.0、Music-1.5
🖼️ 图像模型 Image-01

二、DeepSeek 模型时间线

魔塔社区:DeepSeek @ ModelScope

2026 年

发布时间 模型名称 类别 核心特点
2026-02-11 DeepSeek-V3.2(上下文升级版) 文本 上下文窗口从 128K 扩展至 1M tokens,可一次性处理海量长文本

2025 年

发布时间 模型名称 类别 核心特点
2025-12-01 DeepSeek-V3.2 文本 正式版发布,支持思考 / 非思考双模式切换,定位"话少活好"日常助手,性能比肩 GPT-5
2025-12-01 DeepSeek-V3.2-Speciale 文本 / 推理 "偏科天才",专攻高难度数学、学术研究逻辑验证与编程竞赛解题
2025-09-29 DeepSeek-V3.2-Exp 文本 实验版,引入 DSA 稀疏注意力机制,长文本训练与推理效率大幅提升,API 降价 50% 以上
2025-09-22 DeepSeek-V3.1-Terminus 文本 V3.1 改进版,优化中英混杂问题,增强 Code Agent 与 Search Agent 能力
2025-08-21 DeepSeek-V3.1 文本 引入混合推理架构(单模型同时支持思考与非思考模式),上下文扩展至 128K,Agent 能力大幅增强
2025-05-28 DeepSeek-R1-0528 文本 / 推理 R1 系列旗舰推理模型升级版,让 DeepSeek 声名远播
2025-03-24 DeepSeek-V3-0324 文本 V3 小版本升级,提升推理、代码生成与中文写作能力
2025-01-20 DeepSeek-R1 文本 / 推理 强化学习驱动,推理能力比肩 OpenAI o1,以极低成本引爆全球关注

2024 年及更早

发布时间 模型名称 类别 核心特点
2024-12-26 DeepSeek-V3 文本 671B 参数 MoE 架构,生成速度较 V2 提升 3 倍,正式开源
2024-05-06 DeepSeek-V2 多模态 新增图像理解与生成模块,支持图文联合推理
2023-11-08 DeepSeek-V1 文本 130 亿参数,初代开源模型,支持中英双语
更早 DeepSeek-Coder / DeepSeek-Math 代码 / 数学 代码生成与数学推理领域的专用模型系列

DeepSeek 模型分类汇总

类别 代表模型
🔤 文本模型 V3.2、V3.2-Speciale、V3.1、V3.1-Terminus、V3、V2、V1
🧠 推理模型 R1、R1-0528
💻 代码 / 数学 DeepSeek-Coder、DeepSeek-Math

三、Qwen(通义千问)模型时间线

魔塔社区:Qwen @ ModelScope

2026 年

发布时间 模型名称 类别 核心特点
2026-03-03 Qwen3.5 小尺寸系列(0.8B / 2B / 4B / 9B) 文本 / 端侧 覆盖超轻量到中等规模端侧部署,支持原生 256K 上下文,可运行于移动设备与边缘场景
2026-02-27 Qwen3.5 中等规模系列(Flash / 35B-A3B / 122B-A10B / 27B) 文本 / 多模态 采用 Gated Delta Network + MoE 高效架构,35B-A3B 仅激活 3B 参数即可超越上一代 235B 旗舰,支持 201 种语言
2026-02-16 Qwen3.5-Plus(397B-A17B) 文本 / 多模态 全球首个原生多模态 MoE 大模型,总参 3970 亿仅激活 170 亿,性能媲美万亿参数模型,支持视觉 - 语言统一理解
2026-02-04 Qwen3-Coder-Next(80B-A3B) 代码 / Agent 专为 AI 编程智能体设计,基于 Qwen3-Next 架构,支持 256K 上下文,推理成本显著降低
2026-01-27 Qwen3-Max-Thinking(1T+) 文本 / 推理 阿里规模最大旗舰推理模型,预训练数据 36T Tokens,支持自适应工具调用与多轮迭代推理,19 项基准测试领先
2026-01-12 qwen-image-plus-2026-01-09 图像生成 千问图像生成全新快照版,为 qwen-image-max 蒸馏加速版,支持快速生成高质量图像

2025 年

发布时间 模型名称 类别 核心特点
2025-12 Wan2.6 系列(t2v / i2v / r2v) 视频生成 通义万相视频生成模型升级,支持文生视频、图生视频、参考生视频等多模态创作
2025-09 Qwen3-Omni(30B-A3B) 全模态 / 端到端 原生端到端多语种全模态大模型,流畅处理文本 / 图像 / 音频 / 视频输入,支持实时交互响应
2025-08 Qwen-Image / Qwen-Image-Edit 图像生成 / 编辑 通义千问图像基础模型及编辑模型发布,支持高质量文生图与精细化图像编辑
2025-07 Qwen3 系列(0.6B--32B Dense + 30B / 235B MoE) 文本 / 混合推理 国内首款融合"快思考"与"慢思考"的混合推理模型,支持 /think 模式切换,119 种语言覆盖,强到弱蒸馏技术使小模型继承旗舰能力
2025-04 Qwen3 系列首发 文本 / 推理 阿里巴巴开源新一代通义千问大语言模型系列,涵盖 6 款密集模型和 2 款混合专家模型
2025-03 QwQ-32B 推理 / 数学 开源推理大模型,专注数学推理与逻辑验证,在 AIME、MATH 等基准测试中表现优异
2025-02 Qwen2.5-VL 系列(3B / 7B / 32B / 72B) 视觉语言 新一代多模态视觉理解模型,支持文档解析、长视频理解、视觉代理操作,13 项权威评测视觉理解夺冠
2025-01 Qwen2.5-Max 文本 / MoE 超 20 万亿 token 训练的混合专家架构旗舰模型,通过阿里云 API 提供服务,性能对标世界顶级闭源模型
2025-01 Qwen2.5-1M 系列 文本 / 长上下文 支持 100 万 tokens 超长上下文,采用 YARN 扩展技术,适用于超长文档分析与跨文档推理

2024 年

发布时间 模型名称 类别 核心特点
2024-12 Qwen2.5-Coder 系列(0.5B--32B) 代码生成 专为编程优化的代码模型系列,支持代码生成、理解、调试与重构,在 HumanEval、MBPP 等评测中领先
2024-11 Qwen2.5-Math 系列 数学推理 专注数学问题求解的专用模型,支持多步推理与公式推导,在 MATH、GSM8K 等基准测试中表现突出
2024-09 Qwen2.5 系列(0.5B--72B + MoE) 文本 / 多领域 知识、代码、数学能力全面升级,首次推出领域专用模型(Coder / Math),支持 128K 上下文,29 种语言覆盖
2024-06 Qwen2 系列(0.5B--72B + 57B-A14B MoE) 文本 / 长上下文 新一代开源模型,性能全面超越 Qwen1.5 与 Llama3,部分模型支持 128K 上下文,引入细粒度专家与双块注意力机制
2024-05 CodeQwen1.5 代码生成 通义千问代码模型升级,支持多语言代码生成与理解,与 Qwen1.5 架构对齐,生态兼容性提升
2024-04 Qwen1.5 系列(0.5B--110B + MoE) 文本 / 全面开源 架构与主流模型对齐,所有模型采用 Apache 2.0 协议取消商业限制,统一支持 32K 上下文,极大推动社区普及
2024-02 Qwen1.5 首发 文本 / 开源 里程碑式升级,通过更开放、易用、强大的重构赢得社区广泛赞誉,形成完整尺寸梯度

2023 年及更早

发布时间 模型名称 类别 核心特点
2023-12 Qwen-Audio / Qwen-Audio-Chat 音频理解 业界首个开源大规模音频语言模型,支持 30+ 音频任务,理解语音 / 音乐 / 环境音内容
2023-11 Qwen-VL / Qwen-VL-Chat 视觉语言 基于 Qwen-7B 扩展的多模态模型,支持 448×448 高分辨率图像、中文 OCR 优化、视觉定位与图文对话
2023-09 Qwen-14B / Qwen-72B 文本 推出 140 亿与 720 亿参数模型,性能超越同尺寸开源模型,72B 支持 32K 上下文,逼近 GPT-3.5 水平
2023-08 Qwen-7B / Qwen-7B-Chat 文本 通义千问系列首款开源模型,70 亿参数,基于 2.2 万亿 tokens 预训练,支持 8K 上下文,Apache 2.0 协议开源
2023-04 通义千问 1.0 文本 阿里云峰会正式发布初代通义千问大语言模型,支持中英双语对话与内容创作

Qwen 模型分类汇总

类别 代表模型
🔤 文本模型 Qwen3.5 系列、Qwen3 系列、Qwen2.5 系列、Qwen2 系列、Qwen1.5 系列、Qwen-7B / 14B / 72B
🧠 推理模型 Qwen3-Max-Thinking、QwQ-32B、Qwen3(混合推理模式)
💻 代码模型 Qwen3-Coder 系列、Qwen2.5-Coder 系列、CodeQwen1.5
🔢 数学模型 Qwen2.5-Math 系列
👁️ 视觉语言 Qwen2.5-VL 系列、Qwen-VL、Qwen2-VL
🔊 音频模型 Qwen-Audio、Qwen2-Audio
🌐 全模态 Qwen3-Omni、Qwen2.5-Omni
🖼️ 图像生成 Qwen-Image、Qwen-Image-Edit、qwen-image-plus
🎬 视频生成 Wan2.6 系列(通义万相)
🔍 嵌入 / 重排序 Qwen3-Embedding 系列、Qwen3-Reranker 系列
🛡️ 安全模型 Qwen3Guard 系列

四、三大模型最新版本性能对比(2026 年 3 月)

对比对象:MiniMax M2.7 | DeepSeek-V3.2(1M 上下文版) | Qwen3.5 系列

🔹 核心参数与技术架构对比

维度 MiniMax M2.7 DeepSeek-V3.2(1M 版) Qwen3.5 系列
发布时间 2026-03-18 2026-02-11 2026-02 ~ 03(分批次)
模型类型 文本 / Agent 原生 文本 / 超长上下文 文本 / 多模态 / 端侧
架构创新 Agent Harness 自我进化框架 DSA 稀疏注意力 + 投机采样 Gated Delta Network + MoE 混合架构
参数量 未公开(高效激活设计) ~660B(MoE) 0.8B ~ 397B(多尺寸覆盖)
激活参数 高效稀疏激活 动态稀疏激活 35B 模型仅激活 3B,122B 激活 10B
上下文窗口 标准长上下文(官方未强调极限) 1,000,000 tokens 🔥 256K(端侧)/ 1M(Flash 托管版)
支持语言 多语言(侧重中英) 中英为主,多语言支持 201 种语言 🌐
开源协议 部分开源 + API 服务 ✅ MIT License 完全开源 ✅ Apache 2.0 / 部分模型开源
部署门槛 API 为主,企业级部署 消费级显卡可运行中等版本 0.8B~9B 支持移动端,27B+ 需服务器

🔹 基准测试性能对比(公开数据整理)

数据来源:官方技术报告、第三方评测平台(截至 2026 年 3 月)

评测基准 任务类型 MiniMax M2.7 DeepSeek-V3.2 Qwen3.5-122B
SWE-Pro 软件工程修复 🥇 56.22%(追平 Opus) ~52%(预估) ~54%(预估)
VIBE-Pro 端到端项目交付 🥇 55.6% --- ---
Terminal Bench 2 复杂系统理解 🥇 57.0% --- ---
GDPval-AA(ELO) 专业办公能力 🥇 1495(开源第一) ~1450(预估) ~1480(预估)
MM-Claw 复杂 Skills 遵循 🥇 62.7%(近 Sonnet 4.6) --- ---
MathVista 多模态数学推理 --- --- 🥇 87.4%
MMMU 多学科多模态理解 --- --- 🥇 领先同尺寸模型
HumanEval / MBPP 代码生成 🥈 一线水平 🥇 领先开源模型 🥈 优秀,小模型继承能力强
MMLU-Pro 综合知识理解 🥈 优秀 🥇 接近 GPT-5 水平 🥇 旗舰版媲美万亿参数模型
LongBench / Needle 长上下文检索 --- 🥇 1M 上下文精准检索 🥈 256K~1M 稳定表现

📌 说明:🥇 表示该维度领先或持平国际顶尖闭源模型;--- 表示官方未公开具体数据或该模型非主打方向

🔹 特色能力横向对比

🤖 Agent / 智能体能力
能力维度 MiniMax M2.7 DeepSeek-V3.2 Qwen3.5 系列
自我进化 ✅ 首创"模型参与自身训练",可优化强化学习 Harness ❌ 不支持 ⚠️ 通过蒸馏实现小模型能力继承
多智能体协作 ✅ 原生支持 Agent Teams,角色边界清晰 ⚠️ 需外部框架支持 ✅ 支持多工具调用与任务规划
工具调用遵循率 ✅ 40+ 复杂 Skills 保持 97% 遵循率 ✅ 优秀,支持 Search / Code Agent ✅ 优秀,内置官方工具链(Flash 版)
研发场景替代率 ✅ 30%~50% 工作流自动化 ⚠️ 辅助编码为主 ✅ 支持代码生成 + 调试 + 重构全流程
🧠 推理与专业能力
能力维度 MiniMax M2.7 DeepSeek-V3.2 Qwen3.5 系列
数学 / 逻辑推理 🟡 文字强、推理相对弱 🟢 接近 GPT-5 水平 🟢 Qwen3-Max-Thinking 19 项基准领先
代码工程能力 🟢 生产级排障、日志分析、安全审计 🟢 前端生成美观,HumanEval 领先 🟢 Qwen3-Coder 专为 Agent 编程优化
专业领域知识 🟢 GDPval-AA 开源第一,金融 / 办公突出 🟢 中文写作与搜索优化 🟢 201 语言覆盖,全球化部署友好
多模态理解 🟡 侧重文本 + Agent,多模态非核心 ❌ 纯文本模型 🟢 原生多模态,视觉 - 语言统一理解
🚀 效率与成本对比
维度 MiniMax M2.7 DeepSeek-V3.2 Qwen3.5 系列
推理速度 高吞吐设计,支持 100+ TPS DSA 机制 + 投机采样,60 tokens/s MoE 动态激活,小模型端侧实时响应
显存占用 高效稀疏激活,生产级优化 128K 上下文下消费级显卡可运行 原生 FP8 训练,显存占用降低约 50%
API 成本 1 万美元支持 4 个 Agent 年工作 V3.2 Exp 版 API 降价 50%+ Flash 版输入 $0.03 / 1M tokens(≤128K)
开源友好度 部分模型开源,主打 API 服务 ✅ 完全开源 + MIT 协议,可商用蒸馏 ✅ Apache 2.0 为主,社区生态最活跃

🔹 适用场景推荐指南

不同模型适用场景

📋 快速选型建议
需求 首选推荐 理由
🔧 自动化研发 / 代码排障 MiniMax M2.7 唯一支持"模型自我进化",生产环境故障恢复 < 3 分钟
📚 百万字文档 / 跨文档推理 DeepSeek-V3.2(1M) 原生 1M 上下文,长文本检索精度行业领先
📱 移动端 / 边缘设备部署 Qwen3.5(0.8B~9B) 小尺寸系列专为端侧优化,支持原生 256K 上下文
🎨 图文 / 视频多模态创作 Qwen3.5-Plus / Omni 全球首个原生多模态 MoE,视觉 - 语言统一理解
💰 极致性价比 API 调用 Qwen3.5-Flash $0.03 / 1M tokens 输入,预装工具链,生产级可用
🌍 多语言全球化应用 Qwen3.5 系列 201 种语言支持 + 25 万词表,编码效率提升 60%
🔓 完全开源可商用 DeepSeek-V3.2 MIT 协议,允许蒸馏训练其他模型,社区支持完善

🔹 总结:三大模型核心定位

模型 核心标签 一句话定位
MiniMax M2.7 🤖 Agent 原生 · 自我进化 "让模型参与自身迭代,重塑研发工作流"
DeepSeek-V3.2 📚 超长上下文 · 开源友好 "百万字一键读懂,开源界的性价比之王"
Qwen3.5 系列 🌐 全尺寸覆盖 · 原生多模态 "从手机到云端,一套架构覆盖所有场景"
💡 选型建议
  • 追求极致工程自动化 → 选 MiniMax M2.7
  • 需要处理海量文本 / 完全开源 → 选 DeepSeek-V3.2
  • 要求多模态 + 多尺寸 + 全球化 → 选 Qwen3.5 系列
  • 预算敏感 / 初创团队 → 优先考虑 Qwen3.5-Flash 或 DeepSeek 开源版本

📌 :以上对比基于官方公开信息及第三方评测整理,实际效果可能因具体任务、提示词工程及部署环境而异。建议结合自身业务场景进行小范围实测后再做最终选型。

结束~

相关推荐
光仔December3 小时前
【从0学习Spring AI Alibaba】2、Spring AI Alibaba版本选型及环境搭建
人工智能·大模型·saa·spring ai·ai alibaba
张彦峰ZYF4 小时前
大模型LLM ACA - ACP认证考试模拟试卷六
大模型·llm·aca - acp
guslegend15 小时前
大模型RAG进阶多格式文档解析
人工智能·大模型
靴子学长16 小时前
Decoder only 架构下 - KV cache 的理解
pytorch·深度学习·算法·大模型·kv
我叫张小白。17 小时前
Dify系列(一):平台安装部署+界面操作
docker·ai·语言模型·大模型·dify·智能体
爱喝白开水a1 天前
春节后普通程序员如何“丝滑”跨行AI:不啃算法,也能拿走AI
java·人工智能·算法·spring·ai·前端框架·大模型
人道领域1 天前
注意!2026大模型风口突变:告别云端军备竞赛,端侧AI才是今年最大黑马
人工智能·大模型·端侧ai