本文章主要介绍市面上各常见的AI厂家,并列举各个厂家产品的使用方式,擅长的方向,收费情况以及使用体验,从各个方面列举出各产品之间的差异以及各产品的使用场景等, 本文章中所有的数据均来自于互联网公开渠道。

一. 产品汇总
大模型的主要发布方有:OpenAI、Google、Anthropic、Meta、xAI、阿里通义、智谱AI、百度、字节跳动、月之暗面、MiniMax、科大讯飞、DeepSeek、Mistral AI、Microsoft等,各发布方的官网如下:
- OpenAI: https://www.openai.com
- Google: https://www.google.com
- Anthropic: https://www.anthropic.com
- Meta: https://www.meta.com
- xAI: https://x.ai
- 阿里通义: https://tongyi.aliyun.com
- 智谱AI: https://www.zhipuai.cn
- 百度: https://www.baidu.com
- 字节跳动: https://www.bytedance.com
- 月之暗面: https://kimi.moonshot.cn
- MiniMax: https://www.minimaxi.com
- 科大讯飞: https://www.iflytek.com
- DeepSeek: https://www.deepseek.com
- Mistral AI: https://mistral.ai
- Microsoft: https://www.microsoft.com
- 国际闭源大模型(通用与多模态)
| 模型名称 | 发布方 | 核心特性 | 发布时间 |
|---|---|---|---|
| GPT-5.4 | OpenAI | 100万token超长上下文、原生计算机操作能力、GDPval专业任务胜率83%、支持Thinking推理模式 | 2026年3月 |
| Gemini 3.1 Pro | 200万token上下文、多模态原生理解(文本/图像/视频/音频)、可生成交互式图表与UI仪表盘 | 2026年2月 | |
| Claude 4.6 Sonnet | Anthropic | 代码生成与智能体任务表现全球领先、无短板全能型模型、Elo评分1580 | 2026年2月 |
| Muse Spark | Meta | 闭源旗舰模型,替代Llama系列,聚焦推理与多模态生成 | 2026年3月 |
| Grok 4.2 | xAI | 集成实时信息获取能力,强化社交与趋势分析场景 | 2026年2月 |
- 中国闭源大模型(通用与行业定制)
| 模型名称 | 发布方 | 核心特性 | 发布时间 |
|---|---|---|---|
| Qwen3.6-Plus | 阿里通义 | 3970亿总参数、170亿激活参数、SWE-Bench编程能力超竞品、单日调用量破1.4万亿Token | 2026年4月 |
| Qwen3.5-Omni | 阿里通义 | 全模态原生模型,支持语义打断、音色克隆、语音控制,215项任务刷新SOTA | 2026年3月 |
| GLM-5V-Turbo | 智谱AI | 面向智能体的闭源版本,强化工具调用与多轮任务规划能力 | 2026年4月 |
| GLM-5.1 | 智谱AI | 开源与闭源双版本并行,推理效率提升40%,支持128K上下文 | 2026年4月 |
| 文心一言4.0 | 百度 | 知识增强型架构,支持跨模态理解与企业级API定制 | 2026年初 |
| 豆包2.0 | 字节跳动 | 高性价比对话模型,预置英语学习与写作助手,日均Token使用量超120万亿 | 2026年2月 |
| Kimi K2.5 | 月之暗面 | 长文本处理能力突出,周调用量达0.56万亿Token,位列全球第九 | 2026年3月 |
| MiniMax M2.7 | MiniMax | 周调用量居中国第一,支持多模态交互与企业级Agent部署 | 2026年3月 |
| 星火X2 | 科大讯飞 | 强化语音交互与代码解释能力,支持多语种实时翻译 | 2026年2月 |
- 中国开源大模型(生态主导力量)
| 模型名称 | 发布方 | 核心特性 | 开源状态 |
|---|---|---|---|
| Qwen3.6-Plus | 阿里通义 | Apache 2.0许可,支持消费级硬件部署,累计下载量近10亿次 | ✅ 开源 |
| Qwen2.5系列 | 阿里通义 | 2024年9月起引领全球开源下载量,衍生模型超20万个 | ✅ 开源 |
| GLM-5.1 | 智谱AI | 全面开源,支持多语言、长文本、代码生成,Hugging Face下载量稳居前五 | ✅ 开源 |
| DeepSeek V3.2 | DeepSeek | 高效推理架构,周调用量超4.6万亿Token,中国模型榜首 | ✅ 开源 |
| Mistral Small 4 | Mistral AI | 欧洲代表,轻量化高性能,支持128K上下文 | ✅ 开源 |
| CodeLlama-34B | Meta | 编程专用开源模型,仍为开发者首选 | ✅ 开源 |
| Phi-3.5 | Microsoft | 小参数高表现,移动端部署友好,推理速度极快 | ✅ 开源 |
- 垂直领域大模型(行业落地代表)
| 模型名称 | 所属领域 | 发布方 | 应用场景 |
|---|---|---|---|
| 先锋·隧道大模型 | 工程/基建 | 中国中铁 | 隧道施工风险预测、地质数据智能分析 |
| 先锋·四电大模型 | 工程/电力 | 中国中铁 | 电气化铁路智能运维、信号系统优化 |
| 先锋·工业制造大模型 | 制造业 | 中铁工业 | 生产线故障预测、工艺参数优化 |
| 医疗诊断辅助模型 | 医疗 | 多家三甲医院联合AI企业 | 病历结构化、影像辅助诊断、用药推荐 |
| 金融风控模型 | 金融 | 招商银行、蚂蚁集团等 | 信贷评估、反欺诈、交易行为分析 |
| 法律文书生成模型 | 法律 | 法大大、京东科技 | 合同起草、判例检索、法律咨询 |
二. 使用方式
- 收费模式: 全球主流已统一为按Token计费,中国厂商价格普遍为国际1/3--1/5。
- 入口趋势:App+网页+API三端融合,企业用户倾向私有化部署。
- 功能演进: 从"文本问答"转向多模态交互、工具调用、自主智能体。
- 开源主导: 中国开源模型(Qwen、DeepSeek、GLM)已成全球生态核心,下载量占全球41%。 端侧崛起:iPhone
17、华为昇腾等设备预装7B级模型,实现本地推理、零延迟响应。
1. 国际大模型使用与收费详情
| 模型名称 | 使用方式与入口 | 收费情况 | 核心功能特色 |
|---|---|---|---|
| GPT-5.4 | - 官方入口:https://chat.openai.com- API入口:OpenAI API Dashboard- 国内可用聚合平台:RskAi (ai.rsk.cn) | - GPT-5.4:输入 2.50/百万Token,输出2.50/百万Token,输出 2.50/百万Token,输出15.00/百万Token- GPT-5.4 Mini:输入 0.75/百万Token,输出0.75/百万Token,输出 0.75/百万Token,输出4.50/百万Token- GPT-5.4 Nano:输入 0.20/百万Token,输出0.20/百万Token,输出 0.20/百万Token,输出1.25/百万Token- 无免费额度,需绑定海外支付方式 | - 原生Thinking推理模式,支持复杂多步任务- 计算机操作能力:可自主运行代码、操作UI、调用工具- 支持100万token超长上下文- 专业级任务胜率83%(GDPval基准) |
| Gemini 3.1 Pro | - 官方入口:https://gemini.google.com- API入口:Google AI Studio- 国内镜像站:gemini-cn.com、gemini-chinese.com | - 输入:20万token内 2.00/百万Token,超量2.00/百万Token,超量 2.00/百万Token,超量4.00/百万Token- 输出:20万token内 12.00/百万Token,超量12.00/百万Token,超量 12.00/百万Token,超量18.00/百万Token- 弹性档位:5折优惠,延迟1--15分钟- 缓存档位:按存储Token计费,适合重复查询- 免费用户每日限2次提问 | - 原生多模态架构:文本、图像、音频、视频、代码统一处理- 200万token上下文:可分析整部PDF、数万行代码- 支持交互式图表生成与UI仪表盘构建- MMLU准确率90.0%,HumanEval代码通过率88.9% |
| Claude 4.6 Sonnet | - 官方入口:https://claude.ai- 国内镜像站:snakegpt.vip、gptcat.cc- 支持Slack、Microsoft Teams插件 | - Sonnet 4.6:输入 3.00/百万Token,输出3.00/百万Token,输出 3.00/百万Token,输出15.00/百万Token- Opus 4.6:输入 15.00/百万Token,输出15.00/百万Token,输出 15.00/百万Token,输出75.00/百万Token- 无免费额度,需海外信用卡订阅 | - 智能体协作能力:16个实例协作完成C编译器开发(耗资$2万)- 代码生成与调试能力全球领先- 无短板全能型架构,Elo评分1580- 支持工具调用与多轮任务规划 |
| Grok 4.2 | - 官方入口:https://grok.com- X平台内嵌入口:登录X(推特)→侧边栏Grok图标- 国内镜像站:grok-china.com、snakegpt.vip | - 免费用户:基础功能,每日有限次提问- X Premium+订阅:$16/月,解锁Grok 4.2全功能、实时数据、无广告 | - 实时社交数据接入:直接读取X平台热点、趋势、评论- 独特"幽默模式"与"叛逆模式"- 强化市场分析与跨境社媒运营能力- 支持图像识别与内容生成 |
| Muse Spark | - 仅限私有API预览,面向Meta合作伙伴开放- 无公众网页或App入口 | - 未公开定价,预计按调用量分级收费- 企业定制方案需联系Meta销售团队 | - 专精视觉理解与前端代码复刻- 从UI截图生成高保真HTML/CSS/JS代码- 支持多智能体协同与可视化思维链- 三种推理模式:即时、思考、购物(辅助决策) |
| Phi-3.5 | - 官方入口:Azure AI Studio- 本地部署:Hugging Face、ONNX Runtime- 支持Windows、iPhone 17、华为昇腾端侧部署 | - 免费:开源模型可免费商用- Azure API:按Token计费,价格低于GPT-4,具体未公开 | - 7B小参数,高表现:推理速度极快,延迟<50ms- 支持端侧本地推理,无需联网- 代码生成、数学推理、多语言支持优异- 与Windows 11、Copilot深度集成 |
- 中国大模型使用与收费详情
| 模型名称 | 使用方式与入口 | 收费情况 | 核心功能特色 |
|---|---|---|---|
| Qwen3.6-Plus | - 网页入口:https://qwen.cn- App:通义App- API入口:阿里云百炼平台- 企业版:通过阿里云智能客服定制 | - 免费:通义App内每日有限次使用- API收费:输入 ¥0.8/万Token,输出 ¥2.4/万Token(2026年4月价)- 企业定制:按月订阅,支持私有化部署 | - 3970亿总参数,170亿激活- 100万token上下文,支持完整代码仓库分析- Agentic Coding:自主规划、执行、调试代码- 原生集成通义万相、通义听悟,支持图文音视频多模态 |
| Qwen3.5-Omni | - 网页入口:https://qwen.cn- 实时语音接口:WebSocket(北京/新加坡)- 支持手机摄像头直连,语音+图像输入 | - 免费:通义App内开放体验- API收费:输入 ¥1.2/万Token ,输出 ¥3.6/万Token- 企业级实时语音接口需单独签约 | - 全球最强全模态模型,215项任务SOTA- 支持113种语言/方言语音识别,含海南话、毛利语- Vibe Coding:对着镜头说"做个记账APP",自动生成完整代码- 音色克隆、语调调节、ARIA语音生成技术 |
| GLM-5V-Turbo | - 网页入口:https://chatglm.cn- API入口:智谱AI开放平台- 支持图像→代码、草图→前端 | - 免费额度:每日1000次调用- API收费:输入 ¥1.0/万Token,输出 ¥3.0/万Token- 企业版:支持私有化部署与工具链集成 | - 任意图像生成代码:一张手绘UI草图→完整React/Vue代码- 强化工具调用与多轮任务规划- 专为智能体开发优化,支持LangChain、AutoGen- 支持128K上下文,推理效率提升40% |
| 文心一言4.0 | - 网页入口:https://yiyan.baidu.com- App:百度App内"文心一言"入口- API入口:百度智能云千帆 | - 免费:基础对话、文生图、文件解析- 会员订阅:¥59.9/月 ,解锁高级插件、高精度模型- 企业API:¥0.6/万Token输入,¥1.8/万Token输出 | - 知识增强架构:融合百度知识图谱,事实准确率提升35%- 一键留影:语音生成短视频- 自我检查:自动校验输出逻辑与事实- 支持多图生成、长文档摘要、PPT自动生成 |
| 豆包2.0 | - App:豆包App- 小程序:微信内搜索"豆包"- 支持语音唤醒、AI写作助手 | - 完全免费:无广告、无订阅、无功能限制- 无API开放计划 | - 英语学习助手:口语陪练、作文批改、语法纠正- AI写作:公众号、简历、邮件一键生成- 无水印视频生成:支持AI配音、字幕、剪辑- 日均Token使用量超120万亿,中国最大用户基数模型 |
| Kimi K2.5 | - 网页入口:https://kimi.moonshot.cn- App:Kimi AI- 支持上传PDF、Word、PPT、Excel | - 免费:支持200万token长文本,每日10次高级提问- Kimi Pro:¥25/月,解锁无限长文本、API调用、优先响应 | - 全球最长上下文:支持200万token,可读整本《红楼梦》- PDF/Word智能解析:自动提取表格、图表、关键结论- 周调用量0.56万亿Token,全球第九- 支持多轮对话记忆与知识库构建 |
| MiniMax M2.7 | - 网页入口:https://www.minimaxi.com- API入口:MiniMax开放平台- 企业部署:支持私有云、本地服务器 | - 免费额度:每日500次调用- API收费:输入 ¥0.7/万Token,输出 ¥2.1/万Token- 企业Agent套餐:¥1999/月起,含专属模型微调 | - 周调用量中国第一- 支持多模态交互:语音+图像+文本输入- 专为企业级Agent设计,支持RPA、CRM、ERP系统对接- 支持语音合成与情感识别 |
| 星火X2 | - 网页入口:https://xinghuo.xfyun.cn- App:讯飞听见、星火App- 支持语音输入、代码解释 | - 免费:基础对话、语音转写、代码解释- 星火专业版:¥49.9/月,解锁多语种翻译、深度推理- 企业API:¥0.5/万Token输入,¥1.5/万Token输出 | - 语音交互领先:中英文实时翻译延迟<300ms- 代码解释:可逐行讲解Python、Java、C++逻辑- 支持多语种对话(含藏语、维语)- 与讯飞听见、智能硬件深度集成 |
| DeepSeek V3.2 | - 开源入口:Hugging Face - API入口:DeepSeek官网 - 免费API项目:DeepSeek-Free-API | - 开源模型:完全免费,可商用- 商业API:输入 ¥0.3/万Token ,输出 ¥0.9/万Token(全球最低价)- 企业版支持私有化部署 | - 周调用量超4.6万亿Token,中国开源模型榜首- 稀疏注意力架构,长文本效率提升50% |
- 支持128K上下文,代码能力超越GPT-4
- 兼容OpenAI接口,可无缝替换GPT-4 |
三. 功能特色
1. 国际大模型功能特色
-
GPT-5.4:
- 原生Thinking推理模式,支持复杂多步任务自主拆解与执行
- 计算机操作能力:可自主运行代码、操作UI界面、调用外部工具
- 支持100万token长上下文,适用于全代码库分析与长文档理解
- 专业级任务胜率83%(GDPval基准)
-
Gemini 3.1 Pro:
- 原生多模态架构:文本、图像、音频、视频、代码统一处理,无模态切换延迟
- 200万token上下文 ,可完整分析整部PDF、数万行代码或长视频字幕
- 支持交互式图表生成与动态UI仪表盘构建,直接输出可运行前端代码
- MMLU准确率90.0% ,HumanEval代码通过率88.9%
-
Claude 4.6 Sonnet:
- 智能体协作能力:16个实例协同完成C编译器开发(实测耗资$2万)
- 代码生成与调试能力全球领先,支持工具调用链式规划
- 无短板全能架构,Elo评分1580,在逻辑推理、法律文书、科学写作中表现稳定
- 支持多轮任务记忆与长期目标追踪
-
Grok 4.2:
- 实时社交数据接入:直接读取X平台(推特)热点、趋势、评论与用户情绪
- 独创**"幽默模式"与"叛逆模式"**,适配社媒运营与内容创作
- 强化市场情绪分析与跨境舆情监控能力
- 支持图像识别与生成 ,可从截图生成社交媒体文案
-
Muse Spark:
- 专精视觉理解与前端代码复刻 :从UI截图自动生成高保真HTML/CSS/JS
- 支持多智能体协同与可视化思维链,用于产品原型快速迭代
- 三种推理模式:即时响应、深度思考、购物辅助决策
-
Phi-3.5:
- 7B小参数 ,高表现:推理速度<50ms,延迟极低
- 支持端侧本地推理 ,可在iPhone 17、华为昇腾芯片上无网运行
- 代码生成、数学推理、多语言支持优异,与Windows 11 Copilot深度集成
2. 中国大模型功能特色
-
Qwen3.6-Plus:
- 3970亿总参数,170亿激活,高效平衡性能与成本
- 100万token上下文 ,支持完整代码仓库结构分析与跨文件依赖推理
- Agentic Coding:自主规划、执行、调试代码,无需人工干预
- 原生集成通义万相(图像生成)、通义听悟(语音转写)
-
Qwen3.5-Omni:
- 全球最强全模态模型,215项任务SOTA
- 支持113种语言/方言语音识别,含海南话、毛利语等小语种
- Vibe Coding:对着摄像头说"做个记账APP",自动生成完整可运行代码
- 音色克隆、语调调节、ARIA语音生成技术领先
-
GLM-5V-Turbo:
- 任意图像生成代码:手绘UI草图 → 完整React/Vue前端代码
- 专为智能体开发优化,原生支持LangChain、AutoGen框架
- 工具调用效率提升40%,支持多轮任务动态规划
-
文心一言4.0:
- 知识增强架构:融合百度知识图谱,事实准确率提升35%
- 一键留影:语音输入自动生成带字幕、背景音乐的短视频
- 自我检查机制:自动校验输出逻辑矛盾与事实错误
- 支持多图生成、长文档摘要、PPT自动生成
-
豆包2.0:
- 英语学习助手:口语陪练、作文批改、语法纠错一体化
- AI写作引擎:公众号、简历、邮件、小红书文案一键生成
- 无水印视频生成:支持AI配音、智能剪辑、字幕同步
- 日均Token使用量超120万亿 ,中国最大用户基数模型
-
Kimi K2.5:
- 全球最长上下文:支持200万token,可完整阅读《红楼梦》全本
- PDF/Word智能解析:自动提取表格、图表、关键结论与引用来源支持
- 多轮对话记忆与个人知识库构建 ,适配学术研究与法律文书
-
MiniMax M2.7:
- 周调用量中国第一,企业级Agent部署量领先
- 支持RPA、CRM、ERP系统对接,实现业务流程自动化
- 语音合成与情感识别技术 ,可模拟人类语气与情绪波动
-
星火X2:
- 语音交互领先:中英文实时翻译延迟<300ms
- 代码逐行解释:可讲解Python、Java、C++逻辑,适配教学与调试
- 支持藏语、维语 等少数民族语言对话,服务边疆地区用户
-
DeepSeek V3.2:
- 周调用量超4.6万亿Token,中国开源模型榜首
- 稀疏注意力架构,长文本处理效率提升50%
- 代码能力超越GPT-4,兼容OpenAI接口,可无缝替换GPT-4
- 完全开源可商用,全球下载量第一
