【AI】2026年4月开源模型排行榜

根据截至 2026 年 4 月 21 日 的最新公开信息,以下是市面上已开源模型的分类排名。排名主要依据权威基准测试分数(如 SWE-Bench、Elo 评分、LMSYS 盲测等)、社区活跃度及工程化落地能力。


一、文字生成类(通用 LLM)

排名 模型 机构 架构/参数 核心优势 许可证
1 Llama 4 Maverick Meta MoE / 400B+ 综合得分 88.5,海外生态最丰富,多语言均衡 Llama 4 License
2 DeepSeek-V3.2 深度求索 MoE / 671B 综合得分 87.5,数学与推理能力顶尖,性价比极高 DeepSeek License
3 Qwen3-72B 阿里云 72B 稠密 综合得分 87.2,中文第一,Apache 2.0 可商用 Apache 2.0
4 GLM-5 智谱 AI MoE / 744B 总 / 40B 激活 代码与 Agent 专精,长程任务稳定性 42.1%(SWE-rebench 第一) 开源可商用
5 Llama 4 Scout Meta MoE / 109B 综合得分 85.3,轻量且能力强 Llama 4 License
6 Qwen3-32B 阿里云 32B 综合得分 84.1,消费级显卡可流畅运行 Apache 2.0
7 MiniMax M2.5 MiniMax Sparse MoE / 10B 激活 极速推理(100 TPS),SWE-Bench 80.2%(编程极强) 开源
8 Kimi K2.5 月之暗面 MoE / 200B 总 / 20B 激活 256K 上下文,原生多模态,VideoMMMU 86.6% 开源
9 Yi-Large 2 零一万物 34B 稠密 中文语义、创作、对话顶尖,部署简单稳定 开源
10 Seed-Thinking-v1.5 字节跳动 MoE / 200B 总 / 20B 激活 逻辑推理与流式推理强,AIME/Codeforces 准确率超 75% 开源
11 Mistral Large 2 Mistral AI 24B 欧洲合规首选,轻量高效,GDPR 友好 开源
12 XVERSE-MoE-A4.2B 元象 25.8B 总 / 4.2B 激活 端侧部署王者,仅激活 4.2B,性能媲美 13B 完全开源免费商用

二、编码类(Code LLM)

注:以下仅列出已开源的代码专用模型,Claude Opus 4.6(80.8%)、GPT-5.4(75.1%)等闭源模型未列入。

排名 模型 机构 SWE-Bench Verified 特色能力 许可证
1 MiniMax-M2.5 MiniMax 80.2% 编程能力开源第一,100 TPS 极速,Agent-native 开源
2 Qwen3.6-Plus 阿里云 78.8% Terminal-Bench 61.6(全球第一),原生多模态,1M 上下文 开源
3 GLM-5 智谱 AI 77.8% 长程任务最稳(SWE-rebench 42.1%),24 小时不崩盘 开源
4 Kimi K2.6 月之暗面 80.2%(综合) 2026.4.20 刚开源,SWE-Bench Pro 58.6%,多语言 76.7%,支持 300 子 Agent 并行 免费商用
5 Kimi K2.5 月之暗面 76.8% 原生多模态编程,视觉理解强 开源
6 DeepSeek-V3.2 深度求索 76.4% LiveCodeBench 86.4%,数学推理天花板,成本极低 DeepSeek License
7 Qwen3.5-Plus 阿里云 70.6% 多模态+性价比,前代主力 开源
8 Qwen3-Coder-Next 阿里云 --- SWE-rebench 40.0%,Coder 专项优化 开源

三、图片生成类(Image Generation)

排名 模型 机构 Elo 分数 核心优势 开源情况
1 Flux 2 Max Black Forest Labs 1168 开放权重巅峰,艺术风格范围最广,支持 LoRA 微调 开放权重
2 Flux 2 Dev Black Forest Labs 1245 开发者首选,图像转图像和修复能力卓越 开放权重
3 Flux 2 Schnell Black Forest Labs 1232 极速生成(2-5 秒),本地可跑 开放权重
4 Stable Diffusion 3.5 Large Stability AI 1198 完全开源,ControlNet 生态最完善,可定制性最强 完全开源
5 Hunyuan Image 3.0 腾讯 1238 亚洲语言支持好,官方提供 API 权重开放情况需确认
6 Seedream 4.5 字节跳动 1225 创意美学强,风格迁移和参考能力好 WaveSpeedAI 独家

四、视频生成类(Video Generation)

排名 模型 机构 Elo 分数 核心优势 开源情况
1 HappyHorse 1.0 前阿里淘天团队(张迪) T2V: 1333 / I2V: 1404 2026.4.8 登顶双榜第一,15B 统一 Transformer,原生同步音视频,7 种语言唇形同步,1080p 完全开源+商用授权
2 SkyReels V4 昆仑万维 1245 短剧生成最强,商业化成熟,月活 8000 万+ 开源权重(有商业 API)
3 LTX-2.3 Lightricks 1290 22B 双流架构,生成速度快 开源
4 Wan 2.6 阿里 --- 部分开源,运动质量中等 部分开源

五、语音生成类(TTS / Voice)

排名 模型 机构 参数/特色 核心优势 开源情况
1 LongCat-AudioDiT 美团 3.5B / 1B Seed 基准 SOTA,零样本音色克隆 SIM 0.818,直接在波形潜空间生成,抛弃梅尔谱 完全开源
2 OmniVoice 小米 --- 支持 600+ 语言,基于 58 万小时数据训练,语音克隆+设计+自动语音 开源
3 Step-Audio 阶跃星辰 --- Hugging Face 全球热度 Top 5,产品级语音大模型 开源
4 VoxCPM2 OpenBMB 2B Tokenizer-free,30+ 语言+9 大方言,48kHz 高保真,极致音色克隆 开源
5 IndexTTS-2 IndexTeam --- 零样本语音合成,支持音色克隆、情感迁移、语速调节 开源
6 VoxCPM-1.5 OpenBMB --- 44.1kHz 专业级音质,6.25Hz 标记率,效率优化 开源

总结

截至 2026 年 4 月 21 日,开源模型已在多个领域达到或超越闭源商业模型:

  • 文字/编码:国产模型(Qwen、GLM、MiniMax、Kimi、DeepSeek)已占据开源榜单头部,与 Llama 4 形成双雄格局。
  • 视频HappyHorse 1.0 是历史上首个在 Artificial Analysis Video Arena 双赛道击败所有闭源商业产品的开源模型 。
  • 语音LongCat-AudioDiT 在零样本音色克隆上达到 SOTA,美团、小米、阶跃星辰等纷纷开源高质量 TTS 模型。
  • 图片:Flux 2 系列和 Stable Diffusion 3.5 仍是开源图像生成的核心基座。
相关推荐
天天代码码天天1 小时前
C# OnnxRuntime 部署 DAViD 表面法线估计
人工智能·david 表面法线估计
zhexiao271 小时前
AI提效工具使用实践 Claude Code、NEXT AI DRAW.IO、XREAD
人工智能·draw.io
wangqiaowq1 小时前
RSA2 非对称加密签名
人工智能
踩着两条虫2 小时前
VTJ.PRO 企业级应用开发实战指南
前端·人工智能·低代码·重构·架构
薛定猫AI2 小时前
【深度解析】Graphify 如何为 AI 编程助手构建项目级知识图谱:降低 Token 消耗、提升代码理解效率
人工智能·知识图谱
ok_hahaha2 小时前
AI从头开始-黑马LongGraph-简单学习
人工智能·学习·langchain·lang graph
子午2 小时前
文本情感识别系统~Python+textCNN算法+深度学习+人工智能
人工智能·python·算法
黑金IT2 小时前
通过“套壳”架构打造工业级 AI 视频生成流水线
人工智能·架构·ai视频
Y学院2 小时前
企业级Dify私有化部署全攻略(Docker Compose生产环境实战)
人工智能·docker·语言模型