【人工智能/AI】项目实战一：AI产品汇总（非完全）

本文章主要介绍市面上各常见的AI厂家，并列举各个厂家产品的使用方式，擅长的方向，收费情况以及使用体验，从各个方面列举出各产品之间的差异以及各产品的使用场景等，本文章中所有的数据均来自于互联网公开渠道。

一. 产品汇总

大模型的主要发布方有：OpenAI、Google、Anthropic、Meta、xAI、阿里通义、智谱AI、百度、字节跳动、月之暗面、MiniMax、科大讯飞、DeepSeek、Mistral AI、Microsoft等，各发布方的官网如下：

OpenAI： https://www.openai.com
Google： https://www.google.com
Anthropic： https://www.anthropic.com
Meta： https://www.meta.com
xAI： https://x.ai
阿里通义： https://tongyi.aliyun.com
智谱AI： https://www.zhipuai.cn
百度： https://www.baidu.com
字节跳动： https://www.bytedance.com
月之暗面： https://kimi.moonshot.cn
MiniMax： https://www.minimaxi.com
科大讯飞： https://www.iflytek.com
DeepSeek： https://www.deepseek.com
Mistral AI： https://mistral.ai
Microsoft： https://www.microsoft.com

国际闭源大模型（通用与多模态）

模型名称	发布方	核心特性	发布时间
‌GPT-5.4‌	OpenAI	100万token超长上下文、原生计算机操作能力、GDPval专业任务胜率83%、支持Thinking推理模式	2026年3月
‌Gemini 3.1 Pro‌	Google	200万token上下文、多模态原生理解（文本/图像/视频/音频）、可生成交互式图表与UI仪表盘	2026年2月
‌Claude 4.6 Sonnet‌	Anthropic	代码生成与智能体任务表现全球领先、无短板全能型模型、Elo评分1580	2026年2月
‌Muse Spark‌	Meta	闭源旗舰模型，替代Llama系列，聚焦推理与多模态生成	2026年3月
‌Grok 4.2‌	xAI	集成实时信息获取能力，强化社交与趋势分析场景	2026年2月

中国闭源大模型（通用与行业定制）

模型名称	发布方	核心特性	发布时间
‌Qwen3.6-Plus‌	阿里通义	3970亿总参数、170亿激活参数、SWE-Bench编程能力超竞品、单日调用量破1.4万亿Token	2026年4月
‌Qwen3.5-Omni‌	阿里通义	全模态原生模型，支持语义打断、音色克隆、语音控制，215项任务刷新SOTA	2026年3月
‌GLM-5V-Turbo‌	智谱AI	面向智能体的闭源版本，强化工具调用与多轮任务规划能力	2026年4月
‌GLM-5.1‌	智谱AI	开源与闭源双版本并行，推理效率提升40%，支持128K上下文	2026年4月
‌文心一言4.0‌	百度	知识增强型架构，支持跨模态理解与企业级API定制	2026年初
‌豆包2.0‌	字节跳动	高性价比对话模型，预置英语学习与写作助手，日均Token使用量超120万亿	2026年2月
‌Kimi K2.5‌	月之暗面	长文本处理能力突出，周调用量达0.56万亿Token，位列全球第九	2026年3月
‌MiniMax M2.7‌	MiniMax	周调用量居中国第一，支持多模态交互与企业级Agent部署	2026年3月
‌星火X2‌	科大讯飞	强化语音交互与代码解释能力，支持多语种实时翻译	2026年2月

中国开源大模型（生态主导力量）

模型名称	发布方	核心特性	开源状态
‌Qwen3.6-Plus‌	阿里通义	Apache 2.0许可，支持消费级硬件部署，累计下载量近10亿次	✅ 开源
‌Qwen2.5系列‌	阿里通义	2024年9月起引领全球开源下载量，衍生模型超20万个	✅ 开源
‌GLM-5.1‌	智谱AI	全面开源，支持多语言、长文本、代码生成，Hugging Face下载量稳居前五	✅ 开源
‌DeepSeek V3.2‌	DeepSeek	高效推理架构，周调用量超4.6万亿Token，中国模型榜首	✅ 开源
‌Mistral Small 4‌	Mistral AI	欧洲代表，轻量化高性能，支持128K上下文	✅ 开源
‌CodeLlama-34B‌	Meta	编程专用开源模型，仍为开发者首选	✅ 开源
‌Phi-3.5‌	Microsoft	小参数高表现，移动端部署友好，推理速度极快	✅ 开源

垂直领域大模型（行业落地代表）

模型名称	所属领域	发布方	应用场景
‌先锋·隧道大模型‌	工程/基建	中国中铁	隧道施工风险预测、地质数据智能分析
‌先锋·四电大模型‌	工程/电力	中国中铁	电气化铁路智能运维、信号系统优化
‌先锋·工业制造大模型‌	制造业	中铁工业	生产线故障预测、工艺参数优化
‌医疗诊断辅助模型‌	医疗	多家三甲医院联合AI企业	病历结构化、影像辅助诊断、用药推荐
‌金融风控模型‌	金融	招商银行、蚂蚁集团等	信贷评估、反欺诈、交易行为分析
‌法律文书生成模型‌	法律	法大大、京东科技	合同起草、判例检索、法律咨询

二. 使用方式

‌

收费模式‌： 全球主流已统一为‌按Token计费‌，中国厂商价格普遍为国际1/3--1/5。
入口趋势‌：‌App+网页+API‌三端融合，企业用户倾向‌私有化部署‌。
功能演进‌： 从"文本问答"转向‌多模态交互‌、‌工具调用‌、‌自主智能体‌。
开源主导‌： 中国开源模型（Qwen、DeepSeek、GLM）已成全球生态核心，下载量占全球41%。 ‌端侧崛起‌：iPhone
17、华为昇腾等设备预装7B级模型，实现‌本地推理、零延迟响应‌。

1‌. 国际大模型使用与收费详情

模型名称	使用方式与入口	收费情况	核心功能特色
‌GPT-5.4‌	- 官方入口：https://chat.openai.com- API入口：OpenAI API Dashboard- 国内可用聚合平台：RskAi (ai.rsk.cn)	- ‌GPT-5.4‌：输入 2.50/百万Token，输出2.50/百万Token，输出 2.50/百万Token，输出15.00/百万Token- ‌GPT-5.4 Mini‌：输入 0.75/百万Token，输出0.75/百万Token，输出 0.75/百万Token，输出4.50/百万Token- ‌GPT-5.4 Nano‌：输入 0.20/百万Token，输出0.20/百万Token，输出 0.20/百万Token，输出1.25/百万Token- 无免费额度，需绑定海外支付方式	- 原生‌Thinking推理模式‌，支持复杂多步任务- ‌计算机操作能力‌：可自主运行代码、操作UI、调用工具- 支持100万token超长上下文- 专业级任务胜率83%（GDPval基准）
‌Gemini 3.1 Pro‌	- 官方入口：https://gemini.google.com- API入口：Google AI Studio- 国内镜像站：gemini-cn.com、gemini-chinese.com	- 输入：20万token内 2.00/百万Token，超量2.00/百万Token，超量 2.00/百万Token，超量4.00/百万Token- 输出：20万token内 12.00/百万Token，超量12.00/百万Token，超量 12.00/百万Token，超量18.00/百万Token- ‌弹性档位‌：5折优惠，延迟1--15分钟- ‌缓存档位‌：按存储Token计费，适合重复查询- 免费用户每日限2次提问	- ‌原生多模态架构‌：文本、图像、音频、视频、代码统一处理- ‌200万token上下文‌：可分析整部PDF、数万行代码- 支持‌交互式图表生成‌与‌UI仪表盘构建‌- MMLU准确率90.0%，HumanEval代码通过率88.9%
‌Claude 4.6 Sonnet‌	- 官方入口：https://claude.ai- 国内镜像站：snakegpt.vip、gptcat.cc- 支持Slack、Microsoft Teams插件	- ‌Sonnet 4.6‌：输入 3.00/百万Token，输出3.00/百万Token，输出 3.00/百万Token，输出15.00/百万Token- ‌Opus 4.6‌：输入 15.00/百万Token，输出15.00/百万Token，输出 15.00/百万Token，输出75.00/百万Token- 无免费额度，需海外信用卡订阅	- ‌智能体协作能力‌：16个实例协作完成C编译器开发（耗资$2万）- 代码生成与调试能力全球领先- 无短板全能型架构，Elo评分1580- 支持‌工具调用‌与‌多轮任务规划‌
‌Grok 4.2‌	- 官方入口：https://grok.com- X平台内嵌入口：登录X（推特）→侧边栏Grok图标- 国内镜像站：grok-china.com、snakegpt.vip	- ‌免费用户‌：基础功能，每日有限次提问- ‌X Premium+订阅‌：$16/月，解锁Grok 4.2全功能、实时数据、无广告	- ‌实时社交数据接入‌：直接读取X平台热点、趋势、评论- 独特"幽默模式"与"叛逆模式"- 强化‌市场分析‌与‌跨境社媒运营‌能力- 支持图像识别与内容生成
‌Muse Spark‌	- 仅限‌私有API预览‌，面向Meta合作伙伴开放- 无公众网页或App入口	- 未公开定价，预计按调用量分级收费- 企业定制方案需联系Meta销售团队	- 专精‌视觉理解与前端代码复刻‌- 从UI截图生成高保真HTML/CSS/JS代码- 支持‌多智能体协同‌与‌可视化思维链‌- 三种推理模式：即时、思考、购物（辅助决策）
‌Phi-3.5‌	- 官方入口：Azure AI Studio- 本地部署：Hugging Face、ONNX Runtime- 支持Windows、iPhone 17、华为昇腾端侧部署	- ‌免费‌：开源模型可免费商用- ‌Azure API‌：按Token计费，价格低于GPT-4，具体未公开	- ‌7B小参数，高表现‌：推理速度极快，延迟<50ms- 支持‌端侧本地推理‌，无需联网- 代码生成、数学推理、多语言支持优异- 与Windows 11、Copilot深度集成

中国大模型使用与收费详情

模型名称	使用方式与入口	收费情况	核心功能特色
‌Qwen3.6-Plus‌	- 网页入口：https://qwen.cn- App：通义App- API入口：阿里云百炼平台- 企业版：通过阿里云智能客服定制	- ‌免费‌：通义App内每日有限次使用- ‌API收费‌：输入 ¥0.8/万Token，输出 ¥2.4/万Token（2026年4月价）- 企业定制：按月订阅，支持私有化部署	- ‌3970亿总参数，170亿激活‌- ‌100万token上下文‌，支持完整代码仓库分析- ‌Agentic Coding‌：自主规划、执行、调试代码- 原生集成通义万相、通义听悟，支持图文音视频多模态
‌Qwen3.5-Omni‌	- 网页入口：https://qwen.cn- 实时语音接口：WebSocket（北京/新加坡）- 支持手机摄像头直连，语音+图像输入	- ‌免费‌：通义App内开放体验- ‌API收费‌：输入 ¥1.2/万Token ，输出 ¥3.6/万Token- 企业级实时语音接口需单独签约	- ‌全球最强全模态模型‌，215项任务SOTA- 支持‌113种语言/方言语音识别‌，含海南话、毛利语- ‌Vibe Coding‌：对着镜头说"做个记账APP"，自动生成完整代码- 音色克隆、语调调节、ARIA语音生成技术
‌GLM-5V-Turbo‌	- 网页入口：https://chatglm.cn- API入口：智谱AI开放平台- 支持图像→代码、草图→前端	- ‌免费额度‌：每日1000次调用- ‌API收费‌：输入 ¥1.0/万Token，输出 ¥3.0/万Token- 企业版：支持私有化部署与工具链集成	- ‌任意图像生成代码‌：一张手绘UI草图→完整React/Vue代码- 强化‌工具调用‌与‌多轮任务规划‌- 专为‌智能体开发‌优化，支持LangChain、AutoGen- 支持128K上下文，推理效率提升40%
‌文心一言4.0‌	- 网页入口：https://yiyan.baidu.com- App：百度App内"文心一言"入口- API入口：百度智能云千帆	- ‌免费‌：基础对话、文生图、文件解析- ‌会员订阅‌：¥59.9/月，解锁高级插件、高精度模型- ‌企业API‌：¥0.6/万Token输入，¥1.8/万Token输出	- ‌知识增强架构‌：融合百度知识图谱，事实准确率提升35%- ‌一键留影‌：语音生成短视频- ‌自我检查‌：自动校验输出逻辑与事实- 支持‌多图生成‌、‌长文档摘要‌、‌PPT自动生成‌
‌豆包2.0‌	- App：豆包App- 小程序：微信内搜索"豆包"- 支持语音唤醒、AI写作助手	- ‌完全免费‌：无广告、无订阅、无功能限制- 无API开放计划	- ‌英语学习助手‌：口语陪练、作文批改、语法纠正- ‌AI写作‌：公众号、简历、邮件一键生成- ‌无水印视频生成‌：支持AI配音、字幕、剪辑- 日均Token使用量超120万亿，中国最大用户基数模型
‌Kimi K2.5‌	- 网页入口：https://kimi.moonshot.cn- App：Kimi AI- 支持上传PDF、Word、PPT、Excel	- ‌免费‌：支持200万token长文本，每日10次高级提问- ‌Kimi Pro‌：¥25/月，解锁无限长文本、API调用、优先响应	- ‌全球最长上下文‌：支持200万token，可读整本《红楼梦》- ‌PDF/Word智能解析‌：自动提取表格、图表、关键结论- ‌周调用量0.56万亿Token‌，全球第九- 支持‌多轮对话记忆‌与‌知识库构建‌
‌MiniMax M2.7‌	- 网页入口：https://www.minimaxi.com- API入口：MiniMax开放平台- 企业部署：支持私有云、本地服务器	- ‌免费额度‌：每日500次调用- ‌API收费‌：输入 ¥0.7/万Token，输出 ¥2.1/万Token- 企业Agent套餐：¥1999/月起，含专属模型微调	- ‌周调用量中国第一‌- 支持‌多模态交互‌：语音+图像+文本输入- 专为‌企业级Agent‌设计，支持RPA、CRM、ERP系统对接- 支持‌语音合成‌与‌情感识别‌
‌星火X2‌	- 网页入口：https://xinghuo.xfyun.cn- App：讯飞听见、星火App- 支持语音输入、代码解释	- ‌免费‌：基础对话、语音转写、代码解释- ‌星火专业版‌：¥49.9/月，解锁多语种翻译、深度推理- ‌企业API‌：¥0.5/万Token输入，¥1.5/万Token输出	- ‌语音交互领先‌：中英文实时翻译延迟<300ms- ‌代码解释‌：可逐行讲解Python、Java、C++逻辑- 支持‌多语种对话‌（含藏语、维语）- 与讯飞听见、智能硬件深度集成
‌DeepSeek V3.2‌	- 开源入口：Hugging Face - API入口：DeepSeek官网 - 免费API项目：DeepSeek-Free-API	- ‌开源模型‌：完全免费，可商用- ‌商业API‌：输入 ¥0.3/万Token ，输出 ¥0.9/万Token（全球最低价）- 企业版支持私有化部署	- ‌周调用量超4.6万亿Token‌，中国开源模型榜首- ‌稀疏注意力架构‌，长文本效率提升50%

支持128K上下文，代码能力超越GPT-4
兼容OpenAI接口，可无缝替换GPT-4 |

三. 功能特色

‌1. 国际大模型功能特色‌

‌GPT-5.4‌：
- 原生‌Thinking推理模式‌，支持复杂多步任务自主拆解与执行‌
- 计算机操作能力‌：可自主运行代码、操作UI界面、调用外部工具
- 支持‌100万token长上下文‌，适用于全代码库分析与长文档理解
- 专业级任务胜率‌83%‌（GDPval基准）
Gemini 3.1 Pro‌：
- 原生多模态架构‌：文本、图像、音频、视频、代码统一处理，无模态切换延迟‌
- 200万token上下文‌ ，可完整分析整部PDF、数万行代码或长视频字幕
- 支持‌交互式图表生成‌与‌动态UI仪表盘构建‌，直接输出可运行前端代码
- MMLU准确率‌90.0%‌ ，HumanEval代码通过率‌88.9%‌
Claude 4.6 Sonnet‌：
- ‌智能体协作能力‌：16个实例协同完成C编译器开发（实测耗资$2万）
- 代码生成与调试能力全球领先，支持‌工具调用链式规划‌
- 无短板全能架构，Elo评分‌1580‌，在逻辑推理、法律文书、科学写作中表现稳定
- 支持‌多轮任务记忆‌与‌长期目标追踪‌
  ‌
Grok 4.2‌：
- 实时社交数据接入‌：直接读取X平台（推特）热点、趋势、评论与用户情绪
- 独创**"‌幽默模式‌"与"‌叛逆模式‌"**，适配社媒运营与内容创作
- 强化‌市场情绪分析‌与‌跨境舆情监控‌能力
- 支持图像识别与生成 ，可从截图生成社交媒体文案
  ‌
Muse Spark‌：
- 专精‌视觉理解与前端代码复刻‌ ：从UI截图自动生成高保真HTML/CSS/JS
- 支持‌多智能体协同‌与‌可视化思维链‌，用于产品原型快速迭代
- 三种推理模式：‌即时响应‌、‌深度思考‌、‌购物辅助决策‌
‌Phi-3.5‌：
- ‌7B小参数 ，高表现‌：推理速度<50ms，延迟极低
- 支持‌端侧本地推理‌ ，可在iPhone 17、华为昇腾芯片上无网运行
- 代码生成、数学推理、多语言支持优异，与‌Windows 11 Copilot‌深度集成

2‌. 中国大模型功能特色‌

‌

Qwen3.6-Plus‌：
- ‌3970亿总参数，170亿激活‌，高效平衡性能与成本‌
- 100万token上下文‌ ，支持完整代码仓库结构分析与跨文件依赖推理‌
- Agentic Coding‌：自主规划、执行、调试代码，无需人工干预
- 原生集成‌通义万相‌（图像生成）、‌通义听悟‌（语音转写）
‌Qwen3.5-Omni‌：
- ‌全球最强全模态模型‌，215项任务SOTA
- 支持‌113种语言/方言语音识别‌，含海南话、毛利语等小语种‌
- Vibe Coding‌：对着摄像头说"做个记账APP"，自动生成完整可运行代码
- 音色克隆、语调调节、‌ARIA语音生成‌技术领先
‌GLM-5V-Turbo‌：
- ‌任意图像生成代码‌：手绘UI草图 → 完整React/Vue前端代码
- 专为‌智能体开发‌优化，原生支持LangChain、AutoGen框架
- 工具调用效率提升40%，支持‌多轮任务动态规划‌
  ‌
文心一言4.0‌：
- ‌知识增强架构‌：融合百度知识图谱，事实准确率提升35%‌
- 一键留影‌：语音输入自动生成带字幕、背景音乐的短视频‌
- 自我检查机制‌：自动校验输出逻辑矛盾与事实错误
- 支持‌多图生成‌、‌长文档摘要‌、‌PPT自动生成‌
  ‌
豆包2.0‌：
- 英语学习助手‌：口语陪练、作文批改、语法纠错一体化‌
- AI写作引擎‌：公众号、简历、邮件、小红书文案一键生成‌
- 无水印视频生成‌：支持AI配音、智能剪辑、字幕同步
- 日均Token使用量超‌120万亿‌ ，中国最大用户基数模型
  ‌
Kimi K2.5‌：
- 全球最长上下文‌：支持200万token，可完整阅读《红楼梦》全本‌
- PDF/Word智能解析‌：自动提取表格、图表、关键结论与引用来源支持‌
- 多轮对话记忆‌与‌个人知识库构建‌ ，适配学术研究与法律文书
  ‌
MiniMax M2.7‌：
- ‌周调用量中国第一‌，企业级Agent部署量领先
- 支持‌RPA、CRM、ERP系统对接‌，实现业务流程自动化‌
- 语音合成‌与‌情感识别‌技术 ，可模拟人类语气与情绪波动
  ‌
星火X2‌：
- 语音交互领先‌：中英文实时翻译延迟<300ms‌
- 代码逐行解释‌：可讲解Python、Java、C++逻辑，适配教学与调试
- 支持‌藏语、维语‌ 等少数民族语言对话，服务边疆地区用户
  ‌
DeepSeek V3.2‌：
- ‌周调用量超4.6万亿Token‌，中国开源模型榜首‌
- 稀疏注意力架构‌，长文本处理效率提升50%
- 代码能力超越GPT-4，兼容OpenAI接口，可无缝替换GPT-4‌
- 完全开源可商用‌，全球下载量第一