大模型根据数据媒体类型分类及基于模型的产品特点

数据媒体类型 常见应用 代表模型 开源情况 基于模型的产品 模型所属厂商 产品特点 收费情况
语言大模型 智能客服、内容创作、推理任务 ERNIE 4.0 / 文心5.0 ‌部分开源‌ 文心一言App、千帆大模型平台 百度 支持超长文本理解、多轮对话、代码生成,文心5.0为原生全模态模型,参数达2.4万亿 免费+企业API按量收费
DeepSeek-V3 ‌开源‌ DeepSeek Chat、API服务 深度求索(DeepSeek) 推理能力强,支持128K上下文,适合复杂逻辑任务 免费+Pro版本订阅制
GLM-4.6V ‌闭源‌ 智谱AI助手 智谱华章 视觉推理能力突出,支持图文混合输入与因果分析 免费+企业级服务收费
PaLM 2 / PaLM 3 ‌闭源‌ Bard、Gemini Google 多语言支持强,集成Google生态,响应速度快 Gemini Pro按量收费
Grok ‌闭源‌ Grok 聊天机器人 xAI(埃隆·马斯克) 实时联网获取X平台数据,风格幽默,具备记忆功能 仅限X平台Premium用户使用
多模态大模型 图文理解、视觉推理、跨模态搜索 GPT-4o ‌闭源‌ ChatGPT(多模态版本) OpenAI 支持文本、图像、音频输入,响应延迟低,交互自然 免费+Plus订阅制
通义千问-Qwen-VL ‌部分开源‌ 通义App、通义万相 阿里巴巴 支持超长图像序列理解,可解析PDF、图表等复杂文档 免费+API调用收费
星火大模型(Spark) ‌闭源‌ 讯飞星火App 科大讯飞 中文理解与语音交互优势明显,支持教育、医疗等行业场景 免费+高级功能订阅
ERNIE-ViLG 2.0 ‌闭源‌ 文心一言文生图功能、AI海报生成 百度 支持细粒度图文对齐,生成内容符合中文审美与语境 集成在文心一言中免费使用
图像生成大模型 AI绘画、艺术创作、广告设计 Midjourney V8.1 ‌闭源‌ Midjourney Discord平台 Midjourney 公司 生成图像艺术感强,风格独特,社区氛围活跃 订阅制(月付$10起)
Stable Diffusion XL ‌完全开源‌ DreamStudio、第三方集成工具 Stability AI 可本地部署,支持插件扩展与精细控制,硬件门槛低 免费+商业托管服务收费
Seedance 2.0 ‌闭源‌ 即梦AI(文生图功能) 字节跳动 生成速度快,支持角色一致性保持,适合短视频内容创作 免费+高级功能订阅
‌ERNIE-Image‌ ‌部分开源‌ 文心一言、ComfyUI插件、AI Studio 百度 支持中文提示优化,生成内容合规性高,适配国内设计需求 免费+平台增值服务收费
视频生成大模型 短视频生成、动态内容创作 Gen-4.5 ‌闭源‌ Runway Gen平台、iOS应用 Runway 支持文本/图像生成视频,具备帧间一致性控制与运动编辑功能 免费+Pro版本订阅制
Pika 1.5 ‌闭源‌ Pika Lab平台 Pika Labs 操作简洁,支持动态运动生成与风格迁移 免费+Pro版本订阅制
VideoWorld ‌闭源‌ 即梦AI(图生视频功能) 字节跳动 生成流畅度高,与即梦AI生态无缝集成 免费+高级功能订阅
语音与音频大模型 语音识别、语音合成、方言支持 Whisper ‌完全开源‌ Whisper API OpenAI 支持99种语言识别,准确率高,可识别口音与背景噪音 免费+API按量收费
豆包语音合成模型2.0 ‌闭源‌ 豆包App语音交互、AI眼镜原型 字节跳动 支持情感化语音输出与方言理解,延迟低 集成在App中免费使用
ERNIE-SAT ‌闭源‌ 语音合成、个性化语音播报 百度 支持多音色选择与情感语调调节,适用于有声内容生产 集成在千帆平台中按量收费
代码大模型 编程辅助、代码生成、文档翻译 CodeLlama ‌完全开源‌ LlamaCoder、第三方IDE插件 Meta 支持多种编程语言,可集成至VS Code等开发环境 免费
StarCoder2 ‌完全开源‌ Hugging Face代码生成工具 BigCode 训练数据量大,支持函数级代码补全 免费
ERNIE-Code ‌闭源‌ 文心一言代码模式、千帆代码助手 百度 支持中文注释理解与生成,具备代码调试与优化建议能力 免费+企业API按量收费
相关推荐
fengliaoai2 天前
DeepSeek搞了个DSpark,AI直接进入“秒回时代”,你还在傻等?
大模型
aqi003 天前
15天学会AI应用开发(九)利用Chroma持久化向量数据
人工智能·python·大模型·ai编程·ai应用
aqi009 天前
15天学会AI应用开发(八)使用向量数据库实现RAG功能
人工智能·python·大模型·ai编程·ai应用
aqi0010 天前
15天学会AI应用开发(七)有了大模型为什么还要引入RAG
人工智能·python·大模型·ai编程·ai应用
vivo互联网技术12 天前
CVPR 2026 | 全新强化学习框架 BeautyGRPO:重塑真实人像
算法·大模型·cvpr·影像
AndrewHZ13 天前
【LLM技术全景】大模型能力探秘:In-Context Learning与思维链(CoT)
人工智能·语言模型·大模型·llm·cot·思维链·icl
Vergelight13 天前
实战拆解|三类RAG架构差异:朴素、进阶、多轮RAG落地选型指南
架构·大模型·aigc·agent·ai产品经理·转行·ai后台设计
问道飞鱼13 天前
【大模型相关】意图识别实现方案行业分析报告
大模型·意图识别
DogDaoDao13 天前
【GitHub】CL4R1T4S:AI 系统提示词的透明革命
人工智能·python·ai·大模型·github·ai agent·cl4r1t4s