2025-2026年大模型全景图:按功能分类与参数规模详解
本文梳理截至2026年2月的全球主流大模型,按功能维度分类,标注参数规模与核心特点。
注 :标注粗体的为2025-2026年发布或更新的最新模型。参数规模中"总参/激活参"表示MoE架构的总参数量与激活参数量。
一、文本理解与生成模型(LLM)
| 模型 | 厂商 | 参数规模 | 发布时间 | 核心特点 |
|---|---|---|---|---|
| GPT-5.1 Instant/Thinking | OpenAI | 未公开 | 2025.11 | 最新旗舰,推理能力大幅提升 |
| GPT-4o / GPT-4o mini | OpenAI | 未公开 | 2024 | 多模态旗舰/轻量版 |
| o1 / o3 | OpenAI | 未公开 | 2024-2025 | 推理专用系列 |
| Claude Opus 4.1 | Anthropic | 未公开 | 2025.08 | 极限复杂推理能力 |
| Claude Sonnet 4.5 | Anthropic | 未公开 | 2025.09 | AI智能体主力模型 |
| Claude Haiku 4.5 | Anthropic | 未公开 | 2025.10 | 高并发低成本场景 |
| Claude 3.5 Sonnet | Anthropic | 未公开 | 2024 | 长上下文200K tokens |
| Gemini 2.0 Flash/Pro | 未公开 | 2024-2025 | 原生多模态,百万级上下文 | |
| Llama 4 Scout | Meta | 未公开(MoE) | 2025.04 | 原生多模态,端侧友好 |
| Llama 4 Maverick | Meta | 未公开(MoE) | 2025.04 | 性能版,对标GPT-4o |
| Llama 4 Behemoth | Meta | 未公开 | 预告中 | 教师模型,超大规模 |
| Qwen3-235B-A22B | 阿里 | 235B总参/22B激活(MoE) | 2025.04 | 旗舰MoE模型 |
| Qwen3-30B-A3B | 阿里 | 30B总参/3B激活(MoE) | 2025.04 | 轻量MoE版 |
| Qwen3-Max | 阿里 | 300B | 2025.09 | 云栖大会发布 |
| Qwen3-Max-Thinking | 阿里 | 万亿级 | 2026.01 | 旗舰推理模型,HLE 58.3分 |
| Qwen3 密集模型系列 | 阿里 | 0.6B/1.5B/4B/8B/14B/32B | 2025.04 | 全规格覆盖端侧到云端 |
| Kimi K2 | Moonshot | 1T总参/32B激活(MoE) | 2025 | 代码+Agent能力 |
| Kimi K2.5 | Moonshot | 未公开 | 2026.01 | 原生视觉理解+工具调用 |
| Kimi k1.5 | Moonshot | 未公开 | 2024 | 长文本推理(200万字) |
| DeepSeek-V3 | DeepSeek | 671B(MoE) | 2024.12 | 国产最强,推理成本极低 |
| DeepSeek-R1 | DeepSeek | 671B/37B(MoE) | 2025.01 | 开源推理SOTA,对标o1 |
| Doubao-Seed-1.6 | 字节跳动 | 未公开 | 2025 | 深度思考模型 |
| Doubao-Seed-1.6-Lite | 字节跳动 | 未公开 | 2025 | 小尺寸深度思考版 |
| GLM-4-9B | 智谱AI | 9B | 2024 | 开源中文优化 |
| Baichuan 4 | 百川智能 | 未公开 | 2024 | 中文场景优化 |
| Yi-1.5 | 零一万物 | 34B/9B/6B | 2024 | 开源长文本 |
| Mistral Large 2 | Mistral AI | 123B | 2024 | 欧洲开源代表 |
| Mixtral 8x22B | Mistral AI | 141B(MoE) | 2024 | 稀疏专家架构 |
二、代码生成与理解模型
| 模型 | 厂商 | 参数规模 | 发布时间 | 核心特点 |
|---|---|---|---|---|
| GitHub Copilot (Codex) | OpenAI/GitHub | 未公开 | 持续更新 | 基于GPT-4,代码补全 |
| Qwen3-Coder-480B-A35B | 阿里 | 480B总参/35B激活(MoE) | 2025.12 | 代码生成旗舰,全球最强 |
| Doubao-Seed-Code-Preview | 字节跳动 | 未公开 | 2025 | 深度思考编程模型 |
| CodeLlama | Meta | 70B/34B/13B/7B | 2023-2024 | 开源多规格 |
| CodeQwen | 阿里 | 7B/1.5B | 2024 | 轻量高效 |
| DeepSeek-Coder-V2 | DeepSeek | 236B/16B(MoE) | 2024 | 代码专用 |
| StarCoder2 | HuggingFace | 15B/7B/3B | 2024 | 开源多语言 |
三、多模态理解模型(视觉-语言)
| 模型 | 厂商 | 参数规模 | 发布时间 | 核心特点 |
|---|---|---|---|---|
| GPT-4o | OpenAI | 未公开 | 2024 | 原生全模态统一架构 |
| Gemini 2.0 Flash/Pro | 未公开 | 2024-2025 | 原生多模态,实时流式 | |
| Llama 4 Scout/Maverick | Meta | 未公开(MoE) | 2025.04 | 原生多模态,视觉理解 |
| Qwen3-Omni-Flash | 阿里 | 未公开 | 2025.12 | 全模态实时流式交互 |
| Kimi K2.5 | Moonshot | 未公开 | 2026.01 | 原生视觉理解,视频分析 |
| Doubao-Seed-1.6-Thinking | 字节跳动 | 未公开 | 2025 | 视觉理解+深度思考 |
| Qwen-VL | 阿里 | 72B/7B/2B | 2024 | 视觉语言对齐 |
| InternVL2 | 上海AI Lab | 72B/26B/8B/4B/2B/1B | 2024 | 全尺寸开源 |
| CogVLM | 智谱AI | 17B | 2023 | 开源视觉语言 |
四、图像生成模型
| 模型 | 厂商 | 参数规模 | 发布时间 | 核心特点 |
|---|---|---|---|---|
| DALL-E 3 | OpenAI | 未公开 | 2023 | 集成GPT-4,语义理解强 |
| Midjourney V6 | Midjourney | 未公开(Diffusion) | 2024 | 艺术风格,美学顶尖 |
| Seedream 4.5 | 字节跳动 | 未公开 | 2025.11 | 图像生成旗舰 |
| SeedEdit 3.0 | 字节跳动 | 未公开 | 2025.06 | 图像编辑,指令跟随 |
| 可图 2.0 (Kolors 2.0) | 快手 | 未公开 | 2025.04 | 60+风格,中文优化 |
| Stable Diffusion 3/3.5 | Stability AI | 8B/其他 | 2024 | 开源可商用 |
| FLUX.1 [pro/dev/schnell] | Black Forest Labs | 12B(Flow) | 2024 | 开源SOTA,多版本 |
| Imagen 3 | 未公开 | 2024 | 高真实感,细节丰富 | |
| 通义万相 | 阿里 | 未公开 | 2024 | 多风格支持 |
五、视频生成模型(2025-2026重点赛道)
| 模型 | 厂商 | 参数规模 | 发布时间 | 核心特点 |
|---|---|---|---|---|
| Seedance 2.0 | 字节跳动 | 未公开(DiT) | 2026.02 | 地表最强,多主体一致性,复杂运动 |
| Seedance 1.0 Pro/Fast | 字节跳动 | 未公开 | 2025.10 | 质量速度平衡,即梦AI集成 |
| Sora | OpenAI | 未公开(DiT) | 2024(内测) | 内测中,物理模拟强 |
| Veo 2 / Veo 3.1 / Veo 3.1 Fast | 未公开 | 2025-2026 | Adobe Firefly集成,多主体一致 | |
| 可灵 3.0 (Kling 3.0) | 快手 | 未公开 | 2026.02 | All-in-One多模态,视频+图像+音频 |
| 可灵 2.0 (Kling 2.0) | 快手 | 未公开 | 2025.04 | 全球视频生成榜首,2分钟长视频 |
| 通义万相 2.1 (Wan 2.1) | 阿里 | 14B/1.3B(开源) | 2025.01 | VBench榜首,已开源,中文优化 |
| 海螺AI (Hailuo) | MiniMax | 未公开 | 持续更新 | 全球用户已创作5.9亿视频 |
| Runway Gen-3 Alpha | Runway | 未公开 | 2024 | 高质量电影级视频 |
| Pika 1.5 | Pika Labs | 未公开 | 2024 | 视频编辑与生成 |
| Luma Dream Machine | Luma AI | 未公开 | 2024 | 快速生成,物理准确 |
| Stable Video Diffusion | Stability AI | 1.3B | 2023 | 开源视频生成 |
| CogVideoX | 智谱AI | 5B/2B | 2024 | 开源DiT架构 |
| Vidu | 生数科技 | 未公开 | 2024 | 国产视频生成 |
六、音频处理与生成模型
| 模型 | 厂商 | 参数规模 | 发布时间 | 核心特点 |
|---|---|---|---|---|
| Whisper v3 | OpenAI | 1.5B/769M/244M | 2023 | 多尺寸语音识别 |
| GPT-4o Voice | OpenAI | 未公开 | 2024 | 端到端原生语音对话 |
| MiniMax Audio | MiniMax | 未公开 | 2025 | 语音+音乐全栈能力 |
| Music 2.0 | MiniMax | 未公开 | 2025 | 5分钟完整歌曲生成 |
| Suno v3 | Suno | 未公开 | 2024 | 音乐生成,人声合成 |
| Udio | Udio | 未公开 | 2024 | 高质量音乐,风格多样 |
| Stable Audio | Stability AI | 1.1B | 2023 | 开源音效生成 |
| AudioCraft (MusicGen/AudioGen) | Meta | 3.3B/1.5B/387M | 2023 | 开源音乐+音效 |
| Seed-TTS | 字节跳动 | 未公开 | 2024 | 高自然度语音合成 |
| CosyVoice | 阿里 | 300M | 2024 | 轻量多语言语音合成 |
七、推理与数学专用模型
| 模型 | 厂商 | 参数规模 | 发布时间 | 核心特点 |
|---|---|---|---|---|
| o1 / o3 | OpenAI | 未公开 | 2024-2025 | RL强化学习推理链 |
| GPT-5.1 Thinking | OpenAI | 未公开 | 2025.11 | 深度推理版本 |
| Claude Opus 4.1 | Anthropic | 未公开 | 2025.08 | 极限复杂推理,数学代码 |
| Qwen3-Max-Thinking | 阿里 | 万亿级 | 2026.01 | HLE评测58.3分,旗舰推理 |
| Qwen3-Think系列 | 阿里 | 未公开 | 2025 | 推理增强版 |
| Kimi K2-Thinking | Moonshot | 1T总参/32B激活(MoE) | 2025.11 | 深度思考,长文本推理 |
| DeepSeek-R1 | DeepSeek | 671B/37B(MoE) | 2025.01 | 开源推理SOTA,数学竞赛级 |
| Qwen2.5-Math | 阿里 | 72B/7B/1.5B | 2024 | 数学竞赛级能力 |
| AlphaGeometry/AlphaProof | DeepMind | 未公开 | 2024 | 数学形式证明 |
八、端侧/轻量部署模型
| 模型 | 厂商 | 参数规模 | 发布时间 | 核心特点 |
|---|---|---|---|---|
| Qwen3-0.6B/1.5B/4B | 阿里 | 0.6B/1.5B/4B | 2025.04 | 边缘设备,手机端 |
| Llama 4 Scout | Meta | 未公开(MoE) | 2025.04 | 端侧多模态,高效推理 |
| Doubao-Seed-1.6-Lite | 字节跳动 | 未公开 | 2025 | 小尺寸深度思考 |
| Llama 3.2 | Meta | 3B/1B | 2024 | 手机端本地运行 |
| Gemma 2 | 9B/4B/2B | 2024 | 设备端AI,Google生态 | |
| Phi-3 | Microsoft | 14B/7B/3.8B/2.7B | 2024 | 小模型大能力 |
| Qwen2.5系列 | 阿里 | 3B/1.8B/0.5B | 2024 | 超轻量端侧覆盖 |
| MiniCPM | 面壁智能 | 2.8B/2B | 2024 | 端侧SOTA性能 |
| SmolLM | HuggingFace | 1.7B/360M/135M | 2024 | 极轻量,开源 |
九、垂直领域与新兴专用模型
| 领域 | 模型 | 厂商 | 参数规模 | 发布时间 | 核心特点 |
|---|---|---|---|---|---|
| 3D生成 | Doubao-Seed3D-1.0 | 字节跳动 | 未公开(DiT) | 2025.09 | 3D资产生成,DiT架构 |
| 翻译 | Doubao-Seed-Translation | 字节跳动 | 7B | 2025.09 | 28语言互译,上下文理解 |
| 法律 | ChatLaw | 北大 | 13B/33B | 2023 | 法律问答,案例检索 |
| 医疗 | Med-PaLM 2 | 540B | 2023 | 医疗诊断,临床问答 | |
| 金融 | BloombergGPT | Bloomberg | 50B | 2023 | 金融分析,专业术语 |
| 金融 | 轩辕(XuanYuan) | 度小满 | 70B/13B | 2023 | 中文金融场景 |
| 科研 | Galactica | Meta | 120B/30B/6.7B | 2022 | 科学文献,知识推理 |
| 科研 | SciGLM | 智谱AI | 10B | 2023 | 科研文献理解 |
规模等级速查表
| 规模等级 | 参数量级 | 代表模型 | 部署场景 |
|---|---|---|---|
| 超大规模 | 万亿级(1000B+) | Qwen3-Max-Thinking, Kimi K2 | 超算中心,科研级 |
| 超大规模 | 400B-1000B | Llama 3.1 405B, DeepSeek-V3 671B, Qwen3-Max 300B | 数据中心集群 |
| 大规模 | 100B-400B | Qwen3-235B-A22B, Mistral Large 2, GPT-4级 | 云端API服务 |
| 中等规模 | 10B-100B | Qwen3-32B/14B, Llama 4系列, InternVL2-26B | 企业私有化部署 |
| 小规模 | 1B-10B | Qwen3-8B/4B, Llama 3.2 11B, 通义万相2.1-14B | 边缘服务器 |
| 端侧模型 | < 3B | Qwen3-0.6B/1.5B, Llama 3.2 1B/3B, MiniCPM 2B | 手机/IoT设备本地 |
2025-2026年大模型发展趋势
-
视频生成大爆发:Seedance 2.0、可灵3.0、Veo 3.1、万相2.1形成四强格局,物理一致性和多主体保持成为关键指标
-
万亿参数时代:Qwen3-Max-Thinking、Kimi K2等进入万亿参数竞赛,MoE架构成为标配
-
MoE架构主流化:所有新旗舰均采用Mixture of Experts(总参大、激活参小),兼顾性能与成本
-
原生多模态统一:Llama 4、Gemini 2.0、Qwen3-Omni不再区分文本/视觉/音频模态,统一架构处理
-
开源与闭源并行:阿里Qwen3全系列、Meta Llama 4、DeepSeek持续开源,与OpenAI/Anthropic闭源模型形成竞争
-
端侧AI普及:3B以下模型能力快速提升,手机本地运行大模型成为标配
-
推理能力专项突破:o3、DeepSeek-R1、Qwen3-Think、Kimi K2-Thinking等专注复杂推理和数学证明
注 :标注粗体的为2025-2026年发布或更新的最新模型。参数规模中"总参/激活参"表示MoE架构的总参数量与激活参数量。