大模型根据数据媒体类型分类及基于模型的产品特点

数据媒体类型 常见应用 代表模型 开源情况 基于模型的产品 模型所属厂商 产品特点 收费情况
语言大模型 智能客服、内容创作、推理任务 ERNIE 4.0 / 文心5.0 ‌部分开源‌ 文心一言App、千帆大模型平台 百度 支持超长文本理解、多轮对话、代码生成,文心5.0为原生全模态模型,参数达2.4万亿 免费+企业API按量收费
DeepSeek-V3 ‌开源‌ DeepSeek Chat、API服务 深度求索(DeepSeek) 推理能力强,支持128K上下文,适合复杂逻辑任务 免费+Pro版本订阅制
GLM-4.6V ‌闭源‌ 智谱AI助手 智谱华章 视觉推理能力突出,支持图文混合输入与因果分析 免费+企业级服务收费
PaLM 2 / PaLM 3 ‌闭源‌ Bard、Gemini Google 多语言支持强,集成Google生态,响应速度快 Gemini Pro按量收费
Grok ‌闭源‌ Grok 聊天机器人 xAI(埃隆·马斯克) 实时联网获取X平台数据,风格幽默,具备记忆功能 仅限X平台Premium用户使用
多模态大模型 图文理解、视觉推理、跨模态搜索 GPT-4o ‌闭源‌ ChatGPT(多模态版本) OpenAI 支持文本、图像、音频输入,响应延迟低,交互自然 免费+Plus订阅制
通义千问-Qwen-VL ‌部分开源‌ 通义App、通义万相 阿里巴巴 支持超长图像序列理解,可解析PDF、图表等复杂文档 免费+API调用收费
星火大模型(Spark) ‌闭源‌ 讯飞星火App 科大讯飞 中文理解与语音交互优势明显,支持教育、医疗等行业场景 免费+高级功能订阅
ERNIE-ViLG 2.0 ‌闭源‌ 文心一言文生图功能、AI海报生成 百度 支持细粒度图文对齐,生成内容符合中文审美与语境 集成在文心一言中免费使用
图像生成大模型 AI绘画、艺术创作、广告设计 Midjourney V8.1 ‌闭源‌ Midjourney Discord平台 Midjourney 公司 生成图像艺术感强,风格独特,社区氛围活跃 订阅制(月付$10起)
Stable Diffusion XL ‌完全开源‌ DreamStudio、第三方集成工具 Stability AI 可本地部署,支持插件扩展与精细控制,硬件门槛低 免费+商业托管服务收费
Seedance 2.0 ‌闭源‌ 即梦AI(文生图功能) 字节跳动 生成速度快,支持角色一致性保持,适合短视频内容创作 免费+高级功能订阅
‌ERNIE-Image‌ ‌部分开源‌ 文心一言、ComfyUI插件、AI Studio 百度 支持中文提示优化,生成内容合规性高,适配国内设计需求 免费+平台增值服务收费
视频生成大模型 短视频生成、动态内容创作 Gen-4.5 ‌闭源‌ Runway Gen平台、iOS应用 Runway 支持文本/图像生成视频,具备帧间一致性控制与运动编辑功能 免费+Pro版本订阅制
Pika 1.5 ‌闭源‌ Pika Lab平台 Pika Labs 操作简洁,支持动态运动生成与风格迁移 免费+Pro版本订阅制
VideoWorld ‌闭源‌ 即梦AI(图生视频功能) 字节跳动 生成流畅度高,与即梦AI生态无缝集成 免费+高级功能订阅
语音与音频大模型 语音识别、语音合成、方言支持 Whisper ‌完全开源‌ Whisper API OpenAI 支持99种语言识别,准确率高,可识别口音与背景噪音 免费+API按量收费
豆包语音合成模型2.0 ‌闭源‌ 豆包App语音交互、AI眼镜原型 字节跳动 支持情感化语音输出与方言理解,延迟低 集成在App中免费使用
ERNIE-SAT ‌闭源‌ 语音合成、个性化语音播报 百度 支持多音色选择与情感语调调节,适用于有声内容生产 集成在千帆平台中按量收费
代码大模型 编程辅助、代码生成、文档翻译 CodeLlama ‌完全开源‌ LlamaCoder、第三方IDE插件 Meta 支持多种编程语言,可集成至VS Code等开发环境 免费
StarCoder2 ‌完全开源‌ Hugging Face代码生成工具 BigCode 训练数据量大,支持函数级代码补全 免费
ERNIE-Code ‌闭源‌ 文心一言代码模式、千帆代码助手 百度 支持中文注释理解与生成,具备代码调试与优化建议能力 免费+企业API按量收费
相关推荐
汤姆yu3 小时前
原生一体化多模态大模型技术研究
ai·大模型·多模态·智能体
小真zzz8 小时前
当“虚构的解决方案”成为试金石:搜极星如何将市场幻想变为可验证的现实?
搜索引擎·ai·大模型·deepseek
隔窗听雨眠9 小时前
基于大模型API的活动策划辅助系统设计与实现
人工智能·大模型
codefan※12 小时前
干掉幻觉实战:如何构建企业级知识图谱增强 RAG
人工智能·大模型·llm·知识图谱·neo4j·rag·graphrag
A-刘晨阳14 小时前
从数据到决策:TimechoAI时序大模型使用指南与深度时序分析能力解析
大模型
张彦峰ZYF14 小时前
LangGraph从零构建生产级 AI Agent 平台的递进式学习项目
人工智能·大模型·langgraph
摸鱼同学14 小时前
LLM 是什么?从 API 调用到 Token 机制
ai·大模型·llm·token·claudecode
jeffer_liu15 小时前
Spring AI 生产级实战-结构化输出
java·人工智能·后端·spring·大模型
爱学习的鱼佬15 小时前
告别内网模型接入烦恼!ModelStandardization:让 Open WebUI等工具无缝对接私有大模型
rust·开源·大模型·openai·openwebui·model api代理·内网部署
Agent_Sea1 天前
IDC/Omdia/Gartner AI平台排名可信度穿透判断:第三方数据该怎么读
人工智能·大模型·ai平台