根据截至 2026 年 4 月 21 日 的最新公开信息,以下是市面上已开源模型的分类排名。排名主要依据权威基准测试分数(如 SWE-Bench、Elo 评分、LMSYS 盲测等)、社区活跃度及工程化落地能力。
一、文字生成类(通用 LLM)
| 排名 | 模型 | 机构 | 架构/参数 | 核心优势 | 许可证 |
|---|---|---|---|---|---|
| 1 | Llama 4 Maverick | Meta | MoE / 400B+ | 综合得分 88.5,海外生态最丰富,多语言均衡 | Llama 4 License |
| 2 | DeepSeek-V3.2 | 深度求索 | MoE / 671B | 综合得分 87.5,数学与推理能力顶尖,性价比极高 | DeepSeek License |
| 3 | Qwen3-72B | 阿里云 | 72B 稠密 | 综合得分 87.2,中文第一,Apache 2.0 可商用 | Apache 2.0 |
| 4 | GLM-5 | 智谱 AI | MoE / 744B 总 / 40B 激活 | 代码与 Agent 专精,长程任务稳定性 42.1%(SWE-rebench 第一) | 开源可商用 |
| 5 | Llama 4 Scout | Meta | MoE / 109B | 综合得分 85.3,轻量且能力强 | Llama 4 License |
| 6 | Qwen3-32B | 阿里云 | 32B | 综合得分 84.1,消费级显卡可流畅运行 | Apache 2.0 |
| 7 | MiniMax M2.5 | MiniMax | Sparse MoE / 10B 激活 | 极速推理(100 TPS),SWE-Bench 80.2%(编程极强) | 开源 |
| 8 | Kimi K2.5 | 月之暗面 | MoE / 200B 总 / 20B 激活 | 256K 上下文,原生多模态,VideoMMMU 86.6% | 开源 |
| 9 | Yi-Large 2 | 零一万物 | 34B 稠密 | 中文语义、创作、对话顶尖,部署简单稳定 | 开源 |
| 10 | Seed-Thinking-v1.5 | 字节跳动 | MoE / 200B 总 / 20B 激活 | 逻辑推理与流式推理强,AIME/Codeforces 准确率超 75% | 开源 |
| 11 | Mistral Large 2 | Mistral AI | 24B | 欧洲合规首选,轻量高效,GDPR 友好 | 开源 |
| 12 | XVERSE-MoE-A4.2B | 元象 | 25.8B 总 / 4.2B 激活 | 端侧部署王者,仅激活 4.2B,性能媲美 13B | 完全开源免费商用 |
二、编码类(Code LLM)
注:以下仅列出已开源的代码专用模型,Claude Opus 4.6(80.8%)、GPT-5.4(75.1%)等闭源模型未列入。
| 排名 | 模型 | 机构 | SWE-Bench Verified | 特色能力 | 许可证 |
|---|---|---|---|---|---|
| 1 | MiniMax-M2.5 | MiniMax | 80.2% | 编程能力开源第一,100 TPS 极速,Agent-native | 开源 |
| 2 | Qwen3.6-Plus | 阿里云 | 78.8% | Terminal-Bench 61.6(全球第一),原生多模态,1M 上下文 | 开源 |
| 3 | GLM-5 | 智谱 AI | 77.8% | 长程任务最稳(SWE-rebench 42.1%),24 小时不崩盘 | 开源 |
| 4 | Kimi K2.6 | 月之暗面 | 80.2%(综合) | 2026.4.20 刚开源,SWE-Bench Pro 58.6%,多语言 76.7%,支持 300 子 Agent 并行 | 免费商用 |
| 5 | Kimi K2.5 | 月之暗面 | 76.8% | 原生多模态编程,视觉理解强 | 开源 |
| 6 | DeepSeek-V3.2 | 深度求索 | 76.4% | LiveCodeBench 86.4%,数学推理天花板,成本极低 | DeepSeek License |
| 7 | Qwen3.5-Plus | 阿里云 | 70.6% | 多模态+性价比,前代主力 | 开源 |
| 8 | Qwen3-Coder-Next | 阿里云 | --- | SWE-rebench 40.0%,Coder 专项优化 | 开源 |
三、图片生成类(Image Generation)
| 排名 | 模型 | 机构 | Elo 分数 | 核心优势 | 开源情况 |
|---|---|---|---|---|---|
| 1 | Flux 2 Max | Black Forest Labs | 1168 | 开放权重巅峰,艺术风格范围最广,支持 LoRA 微调 | 开放权重 |
| 2 | Flux 2 Dev | Black Forest Labs | 1245 | 开发者首选,图像转图像和修复能力卓越 | 开放权重 |
| 3 | Flux 2 Schnell | Black Forest Labs | 1232 | 极速生成(2-5 秒),本地可跑 | 开放权重 |
| 4 | Stable Diffusion 3.5 Large | Stability AI | 1198 | 完全开源,ControlNet 生态最完善,可定制性最强 | 完全开源 |
| 5 | Hunyuan Image 3.0 | 腾讯 | 1238 | 亚洲语言支持好,官方提供 API | 权重开放情况需确认 |
| 6 | Seedream 4.5 | 字节跳动 | 1225 | 创意美学强,风格迁移和参考能力好 | WaveSpeedAI 独家 |
四、视频生成类(Video Generation)
| 排名 | 模型 | 机构 | Elo 分数 | 核心优势 | 开源情况 |
|---|---|---|---|---|---|
| 1 | HappyHorse 1.0 | 前阿里淘天团队(张迪) | T2V: 1333 / I2V: 1404 | 2026.4.8 登顶双榜第一,15B 统一 Transformer,原生同步音视频,7 种语言唇形同步,1080p | 完全开源+商用授权 |
| 2 | SkyReels V4 | 昆仑万维 | 1245 | 短剧生成最强,商业化成熟,月活 8000 万+ | 开源权重(有商业 API) |
| 3 | LTX-2.3 | Lightricks | 1290 | 22B 双流架构,生成速度快 | 开源 |
| 4 | Wan 2.6 | 阿里 | --- | 部分开源,运动质量中等 | 部分开源 |
五、语音生成类(TTS / Voice)
| 排名 | 模型 | 机构 | 参数/特色 | 核心优势 | 开源情况 |
|---|---|---|---|---|---|
| 1 | LongCat-AudioDiT | 美团 | 3.5B / 1B | Seed 基准 SOTA,零样本音色克隆 SIM 0.818,直接在波形潜空间生成,抛弃梅尔谱 | 完全开源 |
| 2 | OmniVoice | 小米 | --- | 支持 600+ 语言,基于 58 万小时数据训练,语音克隆+设计+自动语音 | 开源 |
| 3 | Step-Audio | 阶跃星辰 | --- | Hugging Face 全球热度 Top 5,产品级语音大模型 | 开源 |
| 4 | VoxCPM2 | OpenBMB | 2B | Tokenizer-free,30+ 语言+9 大方言,48kHz 高保真,极致音色克隆 | 开源 |
| 5 | IndexTTS-2 | IndexTeam | --- | 零样本语音合成,支持音色克隆、情感迁移、语速调节 | 开源 |
| 6 | VoxCPM-1.5 | OpenBMB | --- | 44.1kHz 专业级音质,6.25Hz 标记率,效率优化 | 开源 |
总结
截至 2026 年 4 月 21 日,开源模型已在多个领域达到或超越闭源商业模型:
- 文字/编码:国产模型(Qwen、GLM、MiniMax、Kimi、DeepSeek)已占据开源榜单头部,与 Llama 4 形成双雄格局。
- 视频 :HappyHorse 1.0 是历史上首个在 Artificial Analysis Video Arena 双赛道击败所有闭源商业产品的开源模型 。
- 语音 :LongCat-AudioDiT 在零样本音色克隆上达到 SOTA,美团、小米、阶跃星辰等纷纷开源高质量 TTS 模型。
- 图片:Flux 2 系列和 Stable Diffusion 3.5 仍是开源图像生成的核心基座。