2025-2026年大模型全景图:按功能分类与参数规模详解

2025-2026年大模型全景图:按功能分类与参数规模详解

本文梳理截至2026年2月的全球主流大模型,按功能维度分类,标注参数规模与核心特点。
:标注粗体的为2025-2026年发布或更新的最新模型。参数规模中"总参/激活参"表示MoE架构的总参数量与激活参数量。


一、文本理解与生成模型(LLM)

模型 厂商 参数规模 发布时间 核心特点
GPT-5.1 Instant/Thinking OpenAI 未公开 2025.11 最新旗舰,推理能力大幅提升
GPT-4o / GPT-4o mini OpenAI 未公开 2024 多模态旗舰/轻量版
o1 / o3 OpenAI 未公开 2024-2025 推理专用系列
Claude Opus 4.1 Anthropic 未公开 2025.08 极限复杂推理能力
Claude Sonnet 4.5 Anthropic 未公开 2025.09 AI智能体主力模型
Claude Haiku 4.5 Anthropic 未公开 2025.10 高并发低成本场景
Claude 3.5 Sonnet Anthropic 未公开 2024 长上下文200K tokens
Gemini 2.0 Flash/Pro Google 未公开 2024-2025 原生多模态,百万级上下文
Llama 4 Scout Meta 未公开(MoE) 2025.04 原生多模态,端侧友好
Llama 4 Maverick Meta 未公开(MoE) 2025.04 性能版,对标GPT-4o
Llama 4 Behemoth Meta 未公开 预告中 教师模型,超大规模
Qwen3-235B-A22B 阿里 235B总参/22B激活(MoE) 2025.04 旗舰MoE模型
Qwen3-30B-A3B 阿里 30B总参/3B激活(MoE) 2025.04 轻量MoE版
Qwen3-Max 阿里 300B 2025.09 云栖大会发布
Qwen3-Max-Thinking 阿里 万亿级 2026.01 旗舰推理模型,HLE 58.3分
Qwen3 密集模型系列 阿里 0.6B/1.5B/4B/8B/14B/32B 2025.04 全规格覆盖端侧到云端
Kimi K2 Moonshot 1T总参/32B激活(MoE) 2025 代码+Agent能力
Kimi K2.5 Moonshot 未公开 2026.01 原生视觉理解+工具调用
Kimi k1.5 Moonshot 未公开 2024 长文本推理(200万字)
DeepSeek-V3 DeepSeek 671B(MoE) 2024.12 国产最强,推理成本极低
DeepSeek-R1 DeepSeek 671B/37B(MoE) 2025.01 开源推理SOTA,对标o1
Doubao-Seed-1.6 字节跳动 未公开 2025 深度思考模型
Doubao-Seed-1.6-Lite 字节跳动 未公开 2025 小尺寸深度思考版
GLM-4-9B 智谱AI 9B 2024 开源中文优化
Baichuan 4 百川智能 未公开 2024 中文场景优化
Yi-1.5 零一万物 34B/9B/6B 2024 开源长文本
Mistral Large 2 Mistral AI 123B 2024 欧洲开源代表
Mixtral 8x22B Mistral AI 141B(MoE) 2024 稀疏专家架构

二、代码生成与理解模型

模型 厂商 参数规模 发布时间 核心特点
GitHub Copilot (Codex) OpenAI/GitHub 未公开 持续更新 基于GPT-4,代码补全
Qwen3-Coder-480B-A35B 阿里 480B总参/35B激活(MoE) 2025.12 代码生成旗舰,全球最强
Doubao-Seed-Code-Preview 字节跳动 未公开 2025 深度思考编程模型
CodeLlama Meta 70B/34B/13B/7B 2023-2024 开源多规格
CodeQwen 阿里 7B/1.5B 2024 轻量高效
DeepSeek-Coder-V2 DeepSeek 236B/16B(MoE) 2024 代码专用
StarCoder2 HuggingFace 15B/7B/3B 2024 开源多语言

三、多模态理解模型(视觉-语言)

模型 厂商 参数规模 发布时间 核心特点
GPT-4o OpenAI 未公开 2024 原生全模态统一架构
Gemini 2.0 Flash/Pro Google 未公开 2024-2025 原生多模态,实时流式
Llama 4 Scout/Maverick Meta 未公开(MoE) 2025.04 原生多模态,视觉理解
Qwen3-Omni-Flash 阿里 未公开 2025.12 全模态实时流式交互
Kimi K2.5 Moonshot 未公开 2026.01 原生视觉理解,视频分析
Doubao-Seed-1.6-Thinking 字节跳动 未公开 2025 视觉理解+深度思考
Qwen-VL 阿里 72B/7B/2B 2024 视觉语言对齐
InternVL2 上海AI Lab 72B/26B/8B/4B/2B/1B 2024 全尺寸开源
CogVLM 智谱AI 17B 2023 开源视觉语言

四、图像生成模型

模型 厂商 参数规模 发布时间 核心特点
DALL-E 3 OpenAI 未公开 2023 集成GPT-4,语义理解强
Midjourney V6 Midjourney 未公开(Diffusion) 2024 艺术风格,美学顶尖
Seedream 4.5 字节跳动 未公开 2025.11 图像生成旗舰
SeedEdit 3.0 字节跳动 未公开 2025.06 图像编辑,指令跟随
可图 2.0 (Kolors 2.0) 快手 未公开 2025.04 60+风格,中文优化
Stable Diffusion 3/3.5 Stability AI 8B/其他 2024 开源可商用
FLUX.1 [pro/dev/schnell] Black Forest Labs 12B(Flow) 2024 开源SOTA,多版本
Imagen 3 Google 未公开 2024 高真实感,细节丰富
通义万相 阿里 未公开 2024 多风格支持

五、视频生成模型(2025-2026重点赛道)

模型 厂商 参数规模 发布时间 核心特点
Seedance 2.0 字节跳动 未公开(DiT) 2026.02 地表最强,多主体一致性,复杂运动
Seedance 1.0 Pro/Fast 字节跳动 未公开 2025.10 质量速度平衡,即梦AI集成
Sora OpenAI 未公开(DiT) 2024(内测) 内测中,物理模拟强
Veo 2 / Veo 3.1 / Veo 3.1 Fast Google 未公开 2025-2026 Adobe Firefly集成,多主体一致
可灵 3.0 (Kling 3.0) 快手 未公开 2026.02 All-in-One多模态,视频+图像+音频
可灵 2.0 (Kling 2.0) 快手 未公开 2025.04 全球视频生成榜首,2分钟长视频
通义万相 2.1 (Wan 2.1) 阿里 14B/1.3B(开源) 2025.01 VBench榜首,已开源,中文优化
海螺AI (Hailuo) MiniMax 未公开 持续更新 全球用户已创作5.9亿视频
Runway Gen-3 Alpha Runway 未公开 2024 高质量电影级视频
Pika 1.5 Pika Labs 未公开 2024 视频编辑与生成
Luma Dream Machine Luma AI 未公开 2024 快速生成,物理准确
Stable Video Diffusion Stability AI 1.3B 2023 开源视频生成
CogVideoX 智谱AI 5B/2B 2024 开源DiT架构
Vidu 生数科技 未公开 2024 国产视频生成

六、音频处理与生成模型

模型 厂商 参数规模 发布时间 核心特点
Whisper v3 OpenAI 1.5B/769M/244M 2023 多尺寸语音识别
GPT-4o Voice OpenAI 未公开 2024 端到端原生语音对话
MiniMax Audio MiniMax 未公开 2025 语音+音乐全栈能力
Music 2.0 MiniMax 未公开 2025 5分钟完整歌曲生成
Suno v3 Suno 未公开 2024 音乐生成,人声合成
Udio Udio 未公开 2024 高质量音乐,风格多样
Stable Audio Stability AI 1.1B 2023 开源音效生成
AudioCraft (MusicGen/AudioGen) Meta 3.3B/1.5B/387M 2023 开源音乐+音效
Seed-TTS 字节跳动 未公开 2024 高自然度语音合成
CosyVoice 阿里 300M 2024 轻量多语言语音合成

七、推理与数学专用模型

模型 厂商 参数规模 发布时间 核心特点
o1 / o3 OpenAI 未公开 2024-2025 RL强化学习推理链
GPT-5.1 Thinking OpenAI 未公开 2025.11 深度推理版本
Claude Opus 4.1 Anthropic 未公开 2025.08 极限复杂推理,数学代码
Qwen3-Max-Thinking 阿里 万亿级 2026.01 HLE评测58.3分,旗舰推理
Qwen3-Think系列 阿里 未公开 2025 推理增强版
Kimi K2-Thinking Moonshot 1T总参/32B激活(MoE) 2025.11 深度思考,长文本推理
DeepSeek-R1 DeepSeek 671B/37B(MoE) 2025.01 开源推理SOTA,数学竞赛级
Qwen2.5-Math 阿里 72B/7B/1.5B 2024 数学竞赛级能力
AlphaGeometry/AlphaProof DeepMind 未公开 2024 数学形式证明

八、端侧/轻量部署模型

模型 厂商 参数规模 发布时间 核心特点
Qwen3-0.6B/1.5B/4B 阿里 0.6B/1.5B/4B 2025.04 边缘设备,手机端
Llama 4 Scout Meta 未公开(MoE) 2025.04 端侧多模态,高效推理
Doubao-Seed-1.6-Lite 字节跳动 未公开 2025 小尺寸深度思考
Llama 3.2 Meta 3B/1B 2024 手机端本地运行
Gemma 2 Google 9B/4B/2B 2024 设备端AI,Google生态
Phi-3 Microsoft 14B/7B/3.8B/2.7B 2024 小模型大能力
Qwen2.5系列 阿里 3B/1.8B/0.5B 2024 超轻量端侧覆盖
MiniCPM 面壁智能 2.8B/2B 2024 端侧SOTA性能
SmolLM HuggingFace 1.7B/360M/135M 2024 极轻量,开源

九、垂直领域与新兴专用模型

领域 模型 厂商 参数规模 发布时间 核心特点
3D生成 Doubao-Seed3D-1.0 字节跳动 未公开(DiT) 2025.09 3D资产生成,DiT架构
翻译 Doubao-Seed-Translation 字节跳动 7B 2025.09 28语言互译,上下文理解
法律 ChatLaw 北大 13B/33B 2023 法律问答,案例检索
医疗 Med-PaLM 2 Google 540B 2023 医疗诊断,临床问答
金融 BloombergGPT Bloomberg 50B 2023 金融分析,专业术语
金融 轩辕(XuanYuan) 度小满 70B/13B 2023 中文金融场景
科研 Galactica Meta 120B/30B/6.7B 2022 科学文献,知识推理
科研 SciGLM 智谱AI 10B 2023 科研文献理解

规模等级速查表

规模等级 参数量级 代表模型 部署场景
超大规模 万亿级(1000B+) Qwen3-Max-Thinking, Kimi K2 超算中心,科研级
超大规模 400B-1000B Llama 3.1 405B, DeepSeek-V3 671B, Qwen3-Max 300B 数据中心集群
大规模 100B-400B Qwen3-235B-A22B, Mistral Large 2, GPT-4级 云端API服务
中等规模 10B-100B Qwen3-32B/14B, Llama 4系列, InternVL2-26B 企业私有化部署
小规模 1B-10B Qwen3-8B/4B, Llama 3.2 11B, 通义万相2.1-14B 边缘服务器
端侧模型 < 3B Qwen3-0.6B/1.5B, Llama 3.2 1B/3B, MiniCPM 2B 手机/IoT设备本地

2025-2026年大模型发展趋势

  1. 视频生成大爆发:Seedance 2.0、可灵3.0、Veo 3.1、万相2.1形成四强格局,物理一致性和多主体保持成为关键指标

  2. 万亿参数时代:Qwen3-Max-Thinking、Kimi K2等进入万亿参数竞赛,MoE架构成为标配

  3. MoE架构主流化:所有新旗舰均采用Mixture of Experts(总参大、激活参小),兼顾性能与成本

  4. 原生多模态统一:Llama 4、Gemini 2.0、Qwen3-Omni不再区分文本/视觉/音频模态,统一架构处理

  5. 开源与闭源并行:阿里Qwen3全系列、Meta Llama 4、DeepSeek持续开源,与OpenAI/Anthropic闭源模型形成竞争

  6. 端侧AI普及:3B以下模型能力快速提升,手机本地运行大模型成为标配

  7. 推理能力专项突破:o3、DeepSeek-R1、Qwen3-Think、Kimi K2-Thinking等专注复杂推理和数学证明


:标注粗体的为2025-2026年发布或更新的最新模型。参数规模中"总参/激活参"表示MoE架构的总参数量与激活参数量。

相关推荐
陈天伟教授1 小时前
人工智能应用- 扫地机器人:02. 机器人 ≠ 人工智能
人工智能·神经网络·游戏·自然语言处理·机器人·机器翻译
MaoziShan1 小时前
CMU Subword Modeling | 03 Productivity and Generalization
人工智能·机器学习·自然语言处理
2501_924878731 小时前
中小电商自建直播间成本降47%:AI口播智能体轻量部署(含Docker+OBS链路)
人工智能·docker·容器·排序算法·宽度优先
隔壁大炮2 小时前
第二章 多层神经网络
人工智能·深度学习·神经网络·算法
小刘的大模型笔记2 小时前
大数据微调GPU选择
人工智能
@大迁世界2 小时前
一夜蒸发8300亿!华尔街被吓尿了,原来是因为这只AI找到了500个连人类都找不到的致命漏洞……
人工智能
咚咚王者2 小时前
人工智能之视觉领域 计算机视觉 第五章 图像阈值处理
人工智能·计算机视觉
汽车软件工程师0012 小时前
ChatGpt指导嵌入式软件开发能力
人工智能·chatgpt·autosar
丝斯20112 小时前
AI学习笔记整理(70)——AI+CAE
人工智能·笔记·学习