2025-2026年大模型全景图：按功能分类与参数规模详解

本文梳理截至2026年2月的全球主流大模型，按功能维度分类，标注参数规模与核心特点。
注：标注粗体的为2025-2026年发布或更新的最新模型。参数规模中"总参/激活参"表示MoE架构的总参数量与激活参数量。

一、文本理解与生成模型（LLM）

模型	厂商	参数规模	发布时间	核心特点
GPT-5.1 Instant/Thinking	OpenAI	未公开	2025.11	最新旗舰，推理能力大幅提升
GPT-4o / GPT-4o mini	OpenAI	未公开	2024	多模态旗舰/轻量版
o1 / o3	OpenAI	未公开	2024-2025	推理专用系列
Claude Opus 4.1	Anthropic	未公开	2025.08	极限复杂推理能力
Claude Sonnet 4.5	Anthropic	未公开	2025.09	AI智能体主力模型
Claude Haiku 4.5	Anthropic	未公开	2025.10	高并发低成本场景
Claude 3.5 Sonnet	Anthropic	未公开	2024	长上下文200K tokens
Gemini 2.0 Flash/Pro	Google	未公开	2024-2025	原生多模态，百万级上下文
Llama 4 Scout	Meta	未公开(MoE)	2025.04	原生多模态，端侧友好
Llama 4 Maverick	Meta	未公开(MoE)	2025.04	性能版，对标GPT-4o
Llama 4 Behemoth	Meta	未公开	预告中	教师模型，超大规模
Qwen3-235B-A22B	阿里	235B总参/22B激活(MoE)	2025.04	旗舰MoE模型
Qwen3-30B-A3B	阿里	30B总参/3B激活(MoE)	2025.04	轻量MoE版
Qwen3-Max	阿里	300B	2025.09	云栖大会发布
Qwen3-Max-Thinking	阿里	万亿级	2026.01	旗舰推理模型，HLE 58.3分
Qwen3 密集模型系列	阿里	0.6B/1.5B/4B/8B/14B/32B	2025.04	全规格覆盖端侧到云端
Kimi K2	Moonshot	1T总参/32B激活(MoE)	2025	代码+Agent能力
Kimi K2.5	Moonshot	未公开	2026.01	原生视觉理解+工具调用
Kimi k1.5	Moonshot	未公开	2024	长文本推理(200万字)
DeepSeek-V3	DeepSeek	671B(MoE)	2024.12	国产最强，推理成本极低
DeepSeek-R1	DeepSeek	671B/37B(MoE)	2025.01	开源推理SOTA，对标o1
Doubao-Seed-1.6	字节跳动	未公开	2025	深度思考模型
Doubao-Seed-1.6-Lite	字节跳动	未公开	2025	小尺寸深度思考版
GLM-4-9B	智谱AI	9B	2024	开源中文优化
Baichuan 4	百川智能	未公开	2024	中文场景优化
Yi-1.5	零一万物	34B/9B/6B	2024	开源长文本
Mistral Large 2	Mistral AI	123B	2024	欧洲开源代表
Mixtral 8x22B	Mistral AI	141B(MoE)	2024	稀疏专家架构

二、代码生成与理解模型

模型	厂商	参数规模	发布时间	核心特点
GitHub Copilot (Codex)	OpenAI/GitHub	未公开	持续更新	基于GPT-4，代码补全
Qwen3-Coder-480B-A35B	阿里	480B总参/35B激活(MoE)	2025.12	代码生成旗舰，全球最强
Doubao-Seed-Code-Preview	字节跳动	未公开	2025	深度思考编程模型
CodeLlama	Meta	70B/34B/13B/7B	2023-2024	开源多规格
CodeQwen	阿里	7B/1.5B	2024	轻量高效
DeepSeek-Coder-V2	DeepSeek	236B/16B(MoE)	2024	代码专用
StarCoder2	HuggingFace	15B/7B/3B	2024	开源多语言

三、多模态理解模型（视觉-语言）

模型	厂商	参数规模	发布时间	核心特点
GPT-4o	OpenAI	未公开	2024	原生全模态统一架构
Gemini 2.0 Flash/Pro	Google	未公开	2024-2025	原生多模态，实时流式
Llama 4 Scout/Maverick	Meta	未公开(MoE)	2025.04	原生多模态，视觉理解
Qwen3-Omni-Flash	阿里	未公开	2025.12	全模态实时流式交互
Kimi K2.5	Moonshot	未公开	2026.01	原生视觉理解，视频分析
Doubao-Seed-1.6-Thinking	字节跳动	未公开	2025	视觉理解+深度思考
Qwen-VL	阿里	72B/7B/2B	2024	视觉语言对齐
InternVL2	上海AI Lab	72B/26B/8B/4B/2B/1B	2024	全尺寸开源
CogVLM	智谱AI	17B	2023	开源视觉语言

四、图像生成模型

模型	厂商	参数规模	发布时间	核心特点
DALL-E 3	OpenAI	未公开	2023	集成GPT-4，语义理解强
Midjourney V6	Midjourney	未公开(Diffusion)	2024	艺术风格，美学顶尖
Seedream 4.5	字节跳动	未公开	2025.11	图像生成旗舰
SeedEdit 3.0	字节跳动	未公开	2025.06	图像编辑，指令跟随
可图 2.0 (Kolors 2.0)	快手	未公开	2025.04	60+风格，中文优化
Stable Diffusion 3/3.5	Stability AI	8B/其他	2024	开源可商用
FLUX.1 $pro/dev/schnell$	Black Forest Labs	12B(Flow)	2024	开源SOTA，多版本
Imagen 3	Google	未公开	2024	高真实感，细节丰富
通义万相	阿里	未公开	2024	多风格支持

五、视频生成模型（2025-2026重点赛道）

模型	厂商	参数规模	发布时间	核心特点
Seedance 2.0	字节跳动	未公开(DiT)	2026.02	地表最强，多主体一致性，复杂运动
Seedance 1.0 Pro/Fast	字节跳动	未公开	2025.10	质量速度平衡，即梦AI集成
Sora	OpenAI	未公开(DiT)	2024(内测)	内测中，物理模拟强
Veo 2 / Veo 3.1 / Veo 3.1 Fast	Google	未公开	2025-2026	Adobe Firefly集成，多主体一致
可灵 3.0 (Kling 3.0)	快手	未公开	2026.02	All-in-One多模态，视频+图像+音频
可灵 2.0 (Kling 2.0)	快手	未公开	2025.04	全球视频生成榜首，2分钟长视频
通义万相 2.1 (Wan 2.1)	阿里	14B/1.3B(开源)	2025.01	VBench榜首，已开源，中文优化
海螺AI (Hailuo)	MiniMax	未公开	持续更新	全球用户已创作5.9亿视频
Runway Gen-3 Alpha	Runway	未公开	2024	高质量电影级视频
Pika 1.5	Pika Labs	未公开	2024	视频编辑与生成
Luma Dream Machine	Luma AI	未公开	2024	快速生成，物理准确
Stable Video Diffusion	Stability AI	1.3B	2023	开源视频生成
CogVideoX	智谱AI	5B/2B	2024	开源DiT架构
Vidu	生数科技	未公开	2024	国产视频生成

六、音频处理与生成模型

模型	厂商	参数规模	发布时间	核心特点
Whisper v3	OpenAI	1.5B/769M/244M	2023	多尺寸语音识别
GPT-4o Voice	OpenAI	未公开	2024	端到端原生语音对话
MiniMax Audio	MiniMax	未公开	2025	语音+音乐全栈能力
Music 2.0	MiniMax	未公开	2025	5分钟完整歌曲生成
Suno v3	Suno	未公开	2024	音乐生成，人声合成
Udio	Udio	未公开	2024	高质量音乐，风格多样
Stable Audio	Stability AI	1.1B	2023	开源音效生成
AudioCraft (MusicGen/AudioGen)	Meta	3.3B/1.5B/387M	2023	开源音乐+音效
Seed-TTS	字节跳动	未公开	2024	高自然度语音合成
CosyVoice	阿里	300M	2024	轻量多语言语音合成

七、推理与数学专用模型

模型	厂商	参数规模	发布时间	核心特点
o1 / o3	OpenAI	未公开	2024-2025	RL强化学习推理链
GPT-5.1 Thinking	OpenAI	未公开	2025.11	深度推理版本
Claude Opus 4.1	Anthropic	未公开	2025.08	极限复杂推理，数学代码
Qwen3-Max-Thinking	阿里	万亿级	2026.01	HLE评测58.3分，旗舰推理
Qwen3-Think系列	阿里	未公开	2025	推理增强版
Kimi K2-Thinking	Moonshot	1T总参/32B激活(MoE)	2025.11	深度思考，长文本推理
DeepSeek-R1	DeepSeek	671B/37B(MoE)	2025.01	开源推理SOTA，数学竞赛级
Qwen2.5-Math	阿里	72B/7B/1.5B	2024	数学竞赛级能力
AlphaGeometry/AlphaProof	DeepMind	未公开	2024	数学形式证明

八、端侧/轻量部署模型

模型	厂商	参数规模	发布时间	核心特点
Qwen3-0.6B/1.5B/4B	阿里	0.6B/1.5B/4B	2025.04	边缘设备，手机端
Llama 4 Scout	Meta	未公开(MoE)	2025.04	端侧多模态，高效推理
Doubao-Seed-1.6-Lite	字节跳动	未公开	2025	小尺寸深度思考
Llama 3.2	Meta	3B/1B	2024	手机端本地运行
Gemma 2	Google	9B/4B/2B	2024	设备端AI，Google生态
Phi-3	Microsoft	14B/7B/3.8B/2.7B	2024	小模型大能力
Qwen2.5系列	阿里	3B/1.8B/0.5B	2024	超轻量端侧覆盖
MiniCPM	面壁智能	2.8B/2B	2024	端侧SOTA性能
SmolLM	HuggingFace	1.7B/360M/135M	2024	极轻量，开源

九、垂直领域与新兴专用模型

领域	模型	厂商	参数规模	发布时间	核心特点
3D生成	Doubao-Seed3D-1.0	字节跳动	未公开(DiT)	2025.09	3D资产生成，DiT架构
翻译	Doubao-Seed-Translation	字节跳动	7B	2025.09	28语言互译，上下文理解
法律	ChatLaw	北大	13B/33B	2023	法律问答，案例检索
医疗	Med-PaLM 2	Google	540B	2023	医疗诊断，临床问答
金融	BloombergGPT	Bloomberg	50B	2023	金融分析，专业术语
金融	轩辕(XuanYuan)	度小满	70B/13B	2023	中文金融场景
科研	Galactica	Meta	120B/30B/6.7B	2022	科学文献，知识推理
科研	SciGLM	智谱AI	10B	2023	科研文献理解

规模等级速查表

规模等级	参数量级	代表模型	部署场景
超大规模	万亿级(1000B+)	Qwen3-Max-Thinking, Kimi K2	超算中心，科研级
超大规模	400B-1000B	Llama 3.1 405B, DeepSeek-V3 671B, Qwen3-Max 300B	数据中心集群
大规模	100B-400B	Qwen3-235B-A22B, Mistral Large 2, GPT-4级	云端API服务
中等规模	10B-100B	Qwen3-32B/14B, Llama 4系列, InternVL2-26B	企业私有化部署
小规模	1B-10B	Qwen3-8B/4B, Llama 3.2 11B, 通义万相2.1-14B	边缘服务器
端侧模型	< 3B	Qwen3-0.6B/1.5B, Llama 3.2 1B/3B, MiniCPM 2B	手机/IoT设备本地

2025-2026年大模型发展趋势

视频生成大爆发：Seedance 2.0、可灵3.0、Veo 3.1、万相2.1形成四强格局，物理一致性和多主体保持成为关键指标
万亿参数时代：Qwen3-Max-Thinking、Kimi K2等进入万亿参数竞赛，MoE架构成为标配
MoE架构主流化：所有新旗舰均采用Mixture of Experts（总参大、激活参小），兼顾性能与成本
原生多模态统一：Llama 4、Gemini 2.0、Qwen3-Omni不再区分文本/视觉/音频模态，统一架构处理
开源与闭源并行：阿里Qwen3全系列、Meta Llama 4、DeepSeek持续开源，与OpenAI/Anthropic闭源模型形成竞争
端侧AI普及：3B以下模型能力快速提升，手机本地运行大模型成为标配
推理能力专项突破：o3、DeepSeek-R1、Qwen3-Think、Kimi K2-Thinking等专注复杂推理和数学证明

注：标注粗体的为2025-2026年发布或更新的最新模型。参数规模中"总参/激活参"表示MoE架构的总参数量与激活参数量。