| 数据媒体类型 | 常见应用 | 代表模型 | 开源情况 | 基于模型的产品 | 模型所属厂商 | 产品特点 | 收费情况 |
|---|---|---|---|---|---|---|---|
| 语言大模型 | 智能客服、内容创作、推理任务 | ERNIE 4.0 / 文心5.0 | 部分开源 | 文心一言App、千帆大模型平台 | 百度 | 支持超长文本理解、多轮对话、代码生成,文心5.0为原生全模态模型,参数达2.4万亿 | 免费+企业API按量收费 |
| DeepSeek-V3 | 开源 | DeepSeek Chat、API服务 | 深度求索(DeepSeek) | 推理能力强,支持128K上下文,适合复杂逻辑任务 | 免费+Pro版本订阅制 | ||
| GLM-4.6V | 闭源 | 智谱AI助手 | 智谱华章 | 视觉推理能力突出,支持图文混合输入与因果分析 | 免费+企业级服务收费 | ||
| PaLM 2 / PaLM 3 | 闭源 | Bard、Gemini | 多语言支持强,集成Google生态,响应速度快 | Gemini Pro按量收费 | |||
| Grok | 闭源 | Grok 聊天机器人 | xAI(埃隆·马斯克) | 实时联网获取X平台数据,风格幽默,具备记忆功能 | 仅限X平台Premium用户使用 | ||
| 多模态大模型 | 图文理解、视觉推理、跨模态搜索 | GPT-4o | 闭源 | ChatGPT(多模态版本) | OpenAI | 支持文本、图像、音频输入,响应延迟低,交互自然 | 免费+Plus订阅制 |
| 通义千问-Qwen-VL | 部分开源 | 通义App、通义万相 | 阿里巴巴 | 支持超长图像序列理解,可解析PDF、图表等复杂文档 | 免费+API调用收费 | ||
| 星火大模型(Spark) | 闭源 | 讯飞星火App | 科大讯飞 | 中文理解与语音交互优势明显,支持教育、医疗等行业场景 | 免费+高级功能订阅 | ||
| ERNIE-ViLG 2.0 | 闭源 | 文心一言文生图功能、AI海报生成 | 百度 | 支持细粒度图文对齐,生成内容符合中文审美与语境 | 集成在文心一言中免费使用 | ||
| 图像生成大模型 | AI绘画、艺术创作、广告设计 | Midjourney V8.1 | 闭源 | Midjourney Discord平台 | Midjourney 公司 | 生成图像艺术感强,风格独特,社区氛围活跃 | 订阅制(月付$10起) |
| Stable Diffusion XL | 完全开源 | DreamStudio、第三方集成工具 | Stability AI | 可本地部署,支持插件扩展与精细控制,硬件门槛低 | 免费+商业托管服务收费 | ||
| Seedance 2.0 | 闭源 | 即梦AI(文生图功能) | 字节跳动 | 生成速度快,支持角色一致性保持,适合短视频内容创作 | 免费+高级功能订阅 | ||
| ERNIE-Image | 部分开源 | 文心一言、ComfyUI插件、AI Studio | 百度 | 支持中文提示优化,生成内容合规性高,适配国内设计需求 | 免费+平台增值服务收费 | ||
| 视频生成大模型 | 短视频生成、动态内容创作 | Gen-4.5 | 闭源 | Runway Gen平台、iOS应用 | Runway | 支持文本/图像生成视频,具备帧间一致性控制与运动编辑功能 | 免费+Pro版本订阅制 |
| Pika 1.5 | 闭源 | Pika Lab平台 | Pika Labs | 操作简洁,支持动态运动生成与风格迁移 | 免费+Pro版本订阅制 | ||
| VideoWorld | 闭源 | 即梦AI(图生视频功能) | 字节跳动 | 生成流畅度高,与即梦AI生态无缝集成 | 免费+高级功能订阅 | ||
| 语音与音频大模型 | 语音识别、语音合成、方言支持 | Whisper | 完全开源 | Whisper API | OpenAI | 支持99种语言识别,准确率高,可识别口音与背景噪音 | 免费+API按量收费 |
| 豆包语音合成模型2.0 | 闭源 | 豆包App语音交互、AI眼镜原型 | 字节跳动 | 支持情感化语音输出与方言理解,延迟低 | 集成在App中免费使用 | ||
| ERNIE-SAT | 闭源 | 语音合成、个性化语音播报 | 百度 | 支持多音色选择与情感语调调节,适用于有声内容生产 | 集成在千帆平台中按量收费 | ||
| 代码大模型 | 编程辅助、代码生成、文档翻译 | CodeLlama | 完全开源 | LlamaCoder、第三方IDE插件 | Meta | 支持多种编程语言,可集成至VS Code等开发环境 | 免费 |
| StarCoder2 | 完全开源 | Hugging Face代码生成工具 | BigCode | 训练数据量大,支持函数级代码补全 | 免费 | ||
| ERNIE-Code | 闭源 | 文心一言代码模式、千帆代码助手 | 百度 | 支持中文注释理解与生成,具备代码调试与优化建议能力 | 免费+企业API按量收费 |
大模型根据数据媒体类型分类及基于模型的产品特点
qq_白羊座2026-04-24 14:48
相关推荐
龙侠九重天7 小时前
Token是什么?深入理解计费与上下文窗口CoderJia程序员甲7 小时前
GitHub 热榜项目 - 日榜(2026-04-23)AI算法沐枫7 小时前
OpenAI Operator vs Claude Act:两大厂商Agent对比人工小情绪8 小时前
GPT-1 论文深度解读AI算法沐枫8 小时前
从客服转行AI Agent:半年学习与求职复盘淡海水9 小时前
【AI模型】概念-MCP谷哥的小弟9 小时前
大模型核心基础知识(03)—大模型的分类方法与应用场景AI机器学习算法18 小时前
深度学习模型演进:6个里程碑式CNN架构Ztopcloud极拓云视角18 小时前
从 OpenRouter 数据看中美 AI 调用量反转:统计口径、模型路由与多云应对方案