国内外开源与闭源大模型清单

国内外开源与闭源大模型清单

国外

  • 开源

    • LLaMA 3.x(Meta):通用基座,覆盖多尺寸,生态完善。

    • Mixtral 8x7B / Mixtral 22B(Mistral AI):MoE 架构,高效推理。

    • Gemma 1--3(Google):轻量高效,适合端侧与研究。

    • Phi 系列 1.5/3/3.5/4(Microsoft):小型高效,推理能力强化。

    • DBRX(Databricks):开源 MoE,面向通用与数据工作负载。

    • Nemotron‑4 340B(NVIDIA):超大参数,含 Base/Instruct/Reward 三款。

    • Flux.1(Black Forest Labs):开源文生图,强调上下文编辑。

    • Stable Diffusion 3.x(Stability AI):经典开源文生图。

    • Whisper large‑v3(OpenAI):开源通用语音识别。

    • OLMo 1/2(Allen Institute for AI):完全开放研究型模型与数据。

  • 闭源

    • GPT‑4 / GPT‑4o(OpenAI):多模态通用闭源,生态完备。

    • Claude 3/3.5(Anthropic):长上下文与工具使用强,安全合规导向。

    • Gemini 1.5/2.5(Google DeepMind):原生多模态,长上下文与搜索整合。

    • Grok‑3(xAI):推理与对话体验升级。

    • Mistral Large 2(Mistral AI):闭源旗舰商用模型。

    • Command R / Rerank 3(Cohere):企业向商用 API。

    • AI21 Jurassic 2/3(AI21 Labs):商用闭源 LLM。

    • Amazon Titan / Nova(Amazon):闭源模型与多模态服务。

国内

  • 开源

    • 通义千问 Qwen 3 / 2.5(阿里):开源家族最全之一,覆盖文本/代码/多模态/视频。

    • 通义万相 Wan 2.2(阿里):开源视频生成(T2V/I2V/TI2V)。

    • DeepSeek V3 / R1 / Math / Janus(DeepSeek):开源 MoE、推理、数学与多模态。

    • GLM‑4.x / CogView4 / CogVideoX(智谱 AI):对话、图像与视频多模态开源。

    • Baichuan 2--4(百川智能):中文能力强,开源系列完善。

    • InternLM 2.5 / InternVL(上海 AI 实验室):开源基座与多模态,科研/应用并重。

    • MiniCPM / MiniCPM‑V(OpenBMB/清华):轻量高效,端侧友好。

    • Yi 1.5/1.6 / Yi‑Vision(零一万物):通用与多模态开源。

    • BGE 嵌入系列(BAAI):通用文本嵌入/RAG 常用。

  • 闭源

    • 文心一言 4.5(百度):闭源通用,国内应用生态广。

    • 通义千问 Qwen3‑Max(阿里):闭源超大 MoE 旗舰版。

    • 混元 Hunyuan / 腾讯元宝(腾讯):闭源通用与搜索/阅读整合。

    • 豆包 Doubao(字节跳动):闭源通用,长上下文与多模态。

    • 智谱清言(GLM‑4.5 系列)(智谱 AI):闭源对话与多模态。

    • 月之暗面 Kimi(K2 等主力闭源线):闭源长上下文与智能体能力。

    • 百川智能 4.0(百小应):闭源通用与行业化。

    • 盘古 Pangu(华为):闭源政企/行业方案为主。

    • 星火认知大模型(科大讯飞):闭源教育与语音优势。

    • 360 智脑 4.0(三六零):闭源通用与搜索场景。

相关推荐
thinkerCoder12 小时前
SmoothQuant:一种用于大型语言模型的准确高效的训练后量化方法
人工智能·语言模型·自然语言处理
万事可爱^14 小时前
GitCode+昇腾部署Rnj-1模型实践教程
人工智能·深度学习·语言模型·gitcode·本地部署·昇腾npu
哈__15 小时前
实测VLM:昇腾平台上的视觉语言模型测评与优化实践
人工智能·语言模型·自然语言处理·gitcode·sglang
海森大数据15 小时前
数据筛选新范式:以质胜量,揭开大模型后训练黑箱
人工智能·语言模型
Ma04071318 小时前
【论文阅读27】-LMPHM:基于因果网络和大语言模型-增强知识图网络的故障推理诊断
人工智能·语言模型·自然语言处理
longfei.li20 小时前
AI项目工程化落地如何降本30%?
人工智能·语言模型
汉克老师20 小时前
小学生0基础学大语言模型应用(第4课 《数字盒子与算数魔法》)
人工智能·语言模型·自然语言处理·小学生0基础学习大语言模型
泯泷21 小时前
从"手艺人"到"超级个体":我在小破站用AI重构工作方式的2025
aigc·openai·ai编程
开放知识图谱21 小时前
论文浅尝 | G2S:一个用于大语言模型的时间知识图预测的通用到具体的学习框架(ACL2025)
人工智能·学习·语言模型·自然语言处理