【人工智能/AI】项目实战一:AI产品汇总(非完全)

本文章主要介绍市面上各常见的AI厂家,并列举各个厂家产品的使用方式,擅长的方向,收费情况以及使用体验,从各个方面列举出各产品之间的差异以及各产品的使用场景等, 本文章中所有的数据均来自于互联网公开渠道。

一. 产品汇总

大模型的主要发布方有:OpenAI、Google、Anthropic、Meta、xAI、阿里通义、智谱AI、百度、字节跳动、月之暗面、MiniMax、科大讯飞、DeepSeek、Mistral AI、Microsoft等,各发布方的官网如下:

  1. 国际闭源大模型(通用与多模态)
模型名称 发布方 核心特性 发布时间
‌GPT-5.4‌ OpenAI 100万token超长上下文、原生计算机操作能力、GDPval专业任务胜率83%、支持Thinking推理模式 2026年3月
‌Gemini 3.1 Pro‌ Google 200万token上下文、多模态原生理解(文本/图像/视频/音频)、可生成交互式图表与UI仪表盘 2026年2月
‌Claude 4.6 Sonnet‌ Anthropic 代码生成与智能体任务表现全球领先、无短板全能型模型、Elo评分1580 2026年2月
‌Muse Spark‌ Meta 闭源旗舰模型,替代Llama系列,聚焦推理与多模态生成 2026年3月
‌Grok 4.2‌ xAI 集成实时信息获取能力,强化社交与趋势分析场景 2026年2月
  1. 中国闭源大模型(通用与行业定制)
模型名称 发布方 核心特性 发布时间
‌Qwen3.6-Plus‌ 阿里通义 3970亿总参数、170亿激活参数、SWE-Bench编程能力超竞品、单日调用量破1.4万亿Token 2026年4月
‌Qwen3.5-Omni‌ 阿里通义 全模态原生模型,支持语义打断、音色克隆、语音控制,215项任务刷新SOTA 2026年3月
‌GLM-5V-Turbo‌ 智谱AI 面向智能体的闭源版本,强化工具调用与多轮任务规划能力 2026年4月
‌GLM-5.1‌ 智谱AI 开源与闭源双版本并行,推理效率提升40%,支持128K上下文 2026年4月
‌文心一言4.0‌ 百度 知识增强型架构,支持跨模态理解与企业级API定制 2026年初
‌豆包2.0‌ 字节跳动 高性价比对话模型,预置英语学习与写作助手,日均Token使用量超120万亿 2026年2月
‌Kimi K2.5‌ 月之暗面 长文本处理能力突出,周调用量达0.56万亿Token,位列全球第九 2026年3月
‌MiniMax M2.7‌ MiniMax 周调用量居中国第一,支持多模态交互与企业级Agent部署 2026年3月
‌星火X2‌ 科大讯飞 强化语音交互与代码解释能力,支持多语种实时翻译 2026年2月
  1. 中国开源大模型(生态主导力量)
模型名称 发布方 核心特性 开源状态
‌Qwen3.6-Plus‌ 阿里通义 Apache 2.0许可,支持消费级硬件部署,累计下载量近10亿次 ✅ 开源
‌Qwen2.5系列‌ 阿里通义 2024年9月起引领全球开源下载量,衍生模型超20万个 ✅ 开源
‌GLM-5.1‌ 智谱AI 全面开源,支持多语言、长文本、代码生成,Hugging Face下载量稳居前五 ✅ 开源
‌DeepSeek V3.2‌ DeepSeek 高效推理架构,周调用量超4.6万亿Token,中国模型榜首 ✅ 开源
‌Mistral Small 4‌ Mistral AI 欧洲代表,轻量化高性能,支持128K上下文 ✅ 开源
‌CodeLlama-34B‌ Meta 编程专用开源模型,仍为开发者首选 ✅ 开源
‌Phi-3.5‌ Microsoft 小参数高表现,移动端部署友好,推理速度极快 ✅ 开源
  1. 垂直领域大模型(行业落地代表)
模型名称 所属领域 发布方 应用场景
‌先锋·隧道大模型‌ 工程/基建 中国中铁 隧道施工风险预测、地质数据智能分析
‌先锋·四电大模型‌ 工程/电力 中国中铁 电气化铁路智能运维、信号系统优化
‌先锋·工业制造大模型‌ 制造业 中铁工业 生产线故障预测、工艺参数优化
‌医疗诊断辅助模型‌ 医疗 多家三甲医院联合AI企业 病历结构化、影像辅助诊断、用药推荐
‌金融风控模型‌ 金融 招商银行、蚂蚁集团等 信贷评估、反欺诈、交易行为分析
‌法律文书生成模型‌ 法律 法大大、京东科技 合同起草、判例检索、法律咨询

二. 使用方式

  • 收费模式‌: 全球主流已统一为‌按Token计费‌,中国厂商价格普遍为国际1/3--1/5。
  • 入口趋势‌:‌App+网页+API‌三端融合,企业用户倾向‌私有化部署‌。
  • 功能演进‌: 从"文本问答"转向‌多模态交互‌、‌工具调用‌、‌自主智能体‌。
  • 开源主导‌: 中国开源模型(Qwen、DeepSeek、GLM)已成全球生态核心,下载量占全球41%。 ‌端侧崛起‌:iPhone
    17、华为昇腾等设备预装7B级模型,实现‌本地推理、零延迟响应‌。

1‌. 国际大模型使用与收费详情

模型名称 使用方式与入口 收费情况 核心功能特色
‌GPT-5.4‌ - 官方入口:https://chat.openai.com- API入口:OpenAI API Dashboard- 国内可用聚合平台:RskAi (ai.rsk.cn) - ‌GPT-5.4‌:输入 2.50/百万Token,输出2.50/百万Token,输出 2.50/百万Token,输出15.00/百万Token- ‌GPT-5.4 Mini‌:输入 0.75/百万Token,输出0.75/百万Token,输出 0.75/百万Token,输出4.50/百万Token- ‌GPT-5.4 Nano‌:输入 0.20/百万Token,输出0.20/百万Token,输出 0.20/百万Token,输出1.25/百万Token- 无免费额度,需绑定海外支付方式 - 原生‌Thinking推理模式‌,支持复杂多步任务- ‌计算机操作能力‌:可自主运行代码、操作UI、调用工具- 支持100万token超长上下文- 专业级任务胜率83%(GDPval基准)
‌Gemini 3.1 Pro‌ - 官方入口:https://gemini.google.com- API入口:Google AI Studio- 国内镜像站:gemini-cn.comgemini-chinese.com - 输入:20万token内 2.00/百万Token,超量2.00/百万Token,超量 2.00/百万Token,超量4.00/百万Token- 输出:20万token内 12.00/百万Token,超量12.00/百万Token,超量 12.00/百万Token,超量18.00/百万Token- ‌弹性档位‌:5折优惠,延迟1--15分钟- ‌缓存档位‌:按存储Token计费,适合重复查询- 免费用户每日限2次提问 - ‌原生多模态架构‌:文本、图像、音频、视频、代码统一处理- ‌200万token上下文‌:可分析整部PDF、数万行代码- 支持‌交互式图表生成‌与‌UI仪表盘构建‌- MMLU准确率90.0%,HumanEval代码通过率88.9%
‌Claude 4.6 Sonnet‌ - 官方入口:https://claude.ai- 国内镜像站:snakegpt.vip、gptcat.cc- 支持Slack、Microsoft Teams插件 - ‌Sonnet 4.6‌:输入 3.00/百万Token,输出3.00/百万Token,输出 3.00/百万Token,输出15.00/百万Token- ‌Opus 4.6‌:输入 15.00/百万Token,输出15.00/百万Token,输出 15.00/百万Token,输出75.00/百万Token- 无免费额度,需海外信用卡订阅 - ‌智能体协作能力‌:16个实例协作完成C编译器开发(耗资$2万)- 代码生成与调试能力全球领先- 无短板全能型架构,Elo评分1580- 支持‌工具调用‌与‌多轮任务规划‌
‌Grok 4.2‌ - 官方入口:https://grok.com- X平台内嵌入口:登录X(推特)→侧边栏Grok图标- 国内镜像站:grok-china.com、snakegpt.vip - ‌免费用户‌:基础功能,每日有限次提问- ‌X Premium+订阅‌:$16/月,解锁Grok 4.2全功能、实时数据、无广告 - ‌实时社交数据接入‌:直接读取X平台热点、趋势、评论- 独特"幽默模式"与"叛逆模式"- 强化‌市场分析‌与‌跨境社媒运营‌能力- 支持图像识别与内容生成
‌Muse Spark‌ - 仅限‌私有API预览‌,面向Meta合作伙伴开放- 无公众网页或App入口 - 未公开定价,预计按调用量分级收费- 企业定制方案需联系Meta销售团队 - 专精‌视觉理解与前端代码复刻‌- 从UI截图生成高保真HTML/CSS/JS代码- 支持‌多智能体协同‌与‌可视化思维链‌- 三种推理模式:即时、思考、购物(辅助决策)
‌Phi-3.5‌ - 官方入口:Azure AI Studio- 本地部署:Hugging Face、ONNX Runtime- 支持Windows、iPhone 17、华为昇腾端侧部署 - ‌免费‌:开源模型可免费商用- ‌Azure API‌:按Token计费,价格低于GPT-4,具体未公开 - ‌7B小参数,高表现‌:推理速度极快,延迟<50ms- 支持‌端侧本地推理‌,无需联网- 代码生成、数学推理、多语言支持优异- 与Windows 11、Copilot深度集成
  1. 中国大模型使用与收费详情
模型名称 使用方式与入口 收费情况 核心功能特色
‌Qwen3.6-Plus‌ - 网页入口:https://qwen.cn- App:通义App- API入口:阿里云百炼平台- 企业版:通过阿里云智能客服定制 - ‌免费‌:通义App内每日有限次使用- ‌API收费‌:输入 ¥0.8/万Token,输出 ¥2.4/万Token(2026年4月价)- 企业定制:按月订阅,支持私有化部署 - ‌3970亿总参数,170亿激活‌- ‌100万token上下文‌,支持完整代码仓库分析- ‌Agentic Coding‌:自主规划、执行、调试代码- 原生集成通义万相、通义听悟,支持图文音视频多模态
‌Qwen3.5-Omni‌ - 网页入口:https://qwen.cn- 实时语音接口:WebSocket(北京/新加坡)- 支持手机摄像头直连,语音+图像输入 - ‌免费‌:通义App内开放体验- ‌API收费‌:输入 ¥1.2/万Token输出 ¥3.6/万Token- 企业级实时语音接口需单独签约 - ‌全球最强全模态模型‌,215项任务SOTA- 支持‌113种语言/方言语音识别‌,含海南话、毛利语- ‌Vibe Coding‌:对着镜头说"做个记账APP",自动生成完整代码- 音色克隆、语调调节、ARIA语音生成技术
‌GLM-5V-Turbo‌ - 网页入口:https://chatglm.cn- API入口:智谱AI开放平台- 支持图像→代码、草图→前端 - ‌免费额度‌:每日1000次调用- ‌API收费‌:输入 ¥1.0/万Token,输出 ¥3.0/万Token- 企业版:支持私有化部署与工具链集成 - ‌任意图像生成代码‌:一张手绘UI草图→完整React/Vue代码- 强化‌工具调用‌与‌多轮任务规划‌- 专为‌智能体开发‌优化,支持LangChain、AutoGen- 支持128K上下文,推理效率提升40%
‌文心一言4.0‌ - 网页入口:https://yiyan.baidu.com- App:百度App内"文心一言"入口- API入口:百度智能云千帆 - ‌免费‌:基础对话、文生图、文件解析- ‌会员订阅‌:¥59.9/月 ,解锁高级插件、高精度模型- ‌企业API‌:¥0.6/万Token输入,¥1.8/万Token输出 - ‌知识增强架构‌:融合百度知识图谱,事实准确率提升35%- ‌一键留影‌:语音生成短视频- ‌自我检查‌:自动校验输出逻辑与事实- 支持‌多图生成‌、‌长文档摘要‌、‌PPT自动生成‌
‌豆包2.0‌ - App:豆包App- 小程序:微信内搜索"豆包"- 支持语音唤醒、AI写作助手 - ‌完全免费‌:无广告、无订阅、无功能限制- 无API开放计划 - ‌英语学习助手‌:口语陪练、作文批改、语法纠正- ‌AI写作‌:公众号、简历、邮件一键生成- ‌无水印视频生成‌:支持AI配音、字幕、剪辑- 日均Token使用量超120万亿,中国最大用户基数模型
‌Kimi K2.5‌ - 网页入口:https://kimi.moonshot.cn- App:Kimi AI- 支持上传PDF、Word、PPT、Excel - ‌免费‌:支持200万token长文本,每日10次高级提问- ‌Kimi Pro‌:¥25/月,解锁无限长文本、API调用、优先响应 - ‌全球最长上下文‌:支持200万token,可读整本《红楼梦》- ‌PDF/Word智能解析‌:自动提取表格、图表、关键结论- ‌周调用量0.56万亿Token‌,全球第九- 支持‌多轮对话记忆‌与‌知识库构建‌
‌MiniMax M2.7‌ - 网页入口:https://www.minimaxi.com- API入口:MiniMax开放平台- 企业部署:支持私有云、本地服务器 - ‌免费额度‌:每日500次调用- ‌API收费‌:输入 ¥0.7/万Token,输出 ¥2.1/万Token- 企业Agent套餐:¥1999/月起,含专属模型微调 - ‌周调用量中国第一‌- 支持‌多模态交互‌:语音+图像+文本输入- 专为‌企业级Agent‌设计,支持RPA、CRM、ERP系统对接- 支持‌语音合成‌与‌情感识别‌
‌星火X2‌ - 网页入口:https://xinghuo.xfyun.cn- App:讯飞听见、星火App- 支持语音输入、代码解释 - ‌免费‌:基础对话、语音转写、代码解释- ‌星火专业版‌:¥49.9/月,解锁多语种翻译、深度推理- ‌企业API‌:¥0.5/万Token输入,¥1.5/万Token输出 - ‌语音交互领先‌:中英文实时翻译延迟<300ms- ‌代码解释‌:可逐行讲解Python、Java、C++逻辑- 支持‌多语种对话‌(含藏语、维语)- 与讯飞听见、智能硬件深度集成
‌DeepSeek V3.2‌ - 开源入口:Hugging Face - API入口:DeepSeek官网 - 免费API项目:DeepSeek-Free-API - ‌开源模型‌:完全免费,可商用- ‌商业API‌:输入 ¥0.3/万Token ,输出 ¥0.9/万Token(全球最低价)- 企业版支持私有化部署 - ‌周调用量超4.6万亿Token‌,中国开源模型榜首- ‌稀疏注意力架构‌,长文本效率提升50%
  • 支持128K上下文,代码能力超越GPT-4
  • 兼容OpenAI接口,可无缝替换GPT-4 |

三. 功能特色

‌1. 国际大模型功能特色‌

  • ‌GPT-5.4‌:

    • 原生‌Thinking推理模式‌,支持复杂多步任务自主拆解与执行‌
    • 计算机操作能力‌:可自主运行代码、操作UI界面、调用外部工具
    • 支持‌100万token长上下文‌,适用于全代码库分析与长文档理解
    • 专业级任务胜率‌83%‌(GDPval基准)
  • Gemini 3.1 Pro‌:

    • 原生多模态架构‌:文本、图像、音频、视频、代码统一处理,无模态切换延迟‌
    • 200万token上下文‌ ,可完整分析整部PDF、数万行代码或长视频字幕
    • 支持‌交互式图表生成‌与‌动态UI仪表盘构建‌,直接输出可运行前端代码
    • MMLU准确率‌90.0%‌ ,HumanEval代码通过率‌88.9%‌
  • Claude 4.6 Sonnet‌:

    • ‌智能体协作能力‌:16个实例协同完成C编译器开发(实测耗资$2万)
    • 代码生成与调试能力全球领先,支持‌工具调用链式规划‌
    • 无短板全能架构,Elo评分‌1580‌,在逻辑推理、法律文书、科学写作中表现稳定
    • 支持‌多轮任务记忆‌与‌长期目标追踪‌
  • Grok 4.2‌:

    • 实时社交数据接入‌:直接读取X平台(推特)热点、趋势、评论与用户情绪
    • 独创**"‌幽默模式‌"与"‌叛逆模式‌"**,适配社媒运营与内容创作
    • 强化‌市场情绪分析‌与‌跨境舆情监控‌能力
    • 支持图像识别与生成 ,可从截图生成社交媒体文案
  • Muse Spark‌:

    • 专精‌视觉理解与前端代码复刻‌从UI截图自动生成高保真HTML/CSS/JS
    • 支持‌多智能体协同‌与‌可视化思维链‌,用于产品原型快速迭代
    • 三种推理模式:‌即时响应‌、‌深度思考‌、‌购物辅助决策‌
  • ‌Phi-3.5‌:

    • 7B小参数 ,高表现‌:推理速度<50ms,延迟极低
    • 支持‌端侧本地推理‌ ,可在iPhone 17、华为昇腾芯片上无网运行
    • 代码生成、数学推理、多语言支持优异,与‌Windows 11 Copilot‌深度集成

2‌. 中国大模型功能特色‌

  • Qwen3.6-Plus‌:

    • ‌3970亿总参数,170亿激活‌,高效平衡性能与成本‌
    • 100万token上下文‌ ,支持完整代码仓库结构分析与跨文件依赖推理‌
    • Agentic Coding‌:自主规划、执行、调试代码,无需人工干预
    • 原生集成‌通义万相‌(图像生成)、‌通义听悟‌(语音转写)
  • ‌Qwen3.5-Omni‌:

    • 全球最强全模态模型‌,215项任务SOTA
    • 支持‌113种语言/方言语音识别‌,含海南话、毛利语等小语种‌
    • Vibe Coding‌:对着摄像头说"做个记账APP",自动生成完整可运行代码
    • 音色克隆、语调调节、‌ARIA语音生成‌技术领先
  • ‌GLM-5V-Turbo‌:

    • 任意图像生成代码‌:手绘UI草图 → 完整React/Vue前端代码
    • 专为‌智能体开发‌优化,原生支持LangChain、AutoGen框架
    • 工具调用效率提升40%,支持‌多轮任务动态规划‌
  • 文心一言4.0‌:

    • 知识增强架构‌:融合百度知识图谱,事实准确率提升35%‌
    • 一键留影‌:语音输入自动生成带字幕、背景音乐的短视频‌
    • 自我检查机制‌:自动校验输出逻辑矛盾与事实错误
    • 支持‌多图生成‌、‌长文档摘要‌、‌PPT自动生成‌
  • 豆包2.0‌:

    • 英语学习助手‌:口语陪练、作文批改、语法纠错一体化‌
    • AI写作引擎‌:公众号、简历、邮件、小红书文案一键生成‌
    • 无水印视频生成‌:支持AI配音、智能剪辑、字幕同步
    • 日均Token使用量超‌120万亿‌ ,中国最大用户基数模型
  • Kimi K2.5‌:

    • 全球最长上下文‌:支持200万token,可完整阅读《红楼梦》全本‌
    • PDF/Word智能解析‌:自动提取表格、图表、关键结论与引用来源支持‌
    • 多轮对话记忆‌与‌个人知识库构建‌ ,适配学术研究与法律文书
  • MiniMax M2.7‌:

    • 周调用量中国第一‌,企业级Agent部署量领先
    • 支持‌RPA、CRM、ERP系统对接‌,实现业务流程自动化‌
    • 语音合成‌与‌情感识别‌技术 ,可模拟人类语气与情绪波动
  • 星火X2‌:

    • 语音交互领先‌:中英文实时翻译延迟<300ms‌
    • 代码逐行解释‌:可讲解Python、Java、C++逻辑,适配教学与调试
    • 支持‌藏语、维语‌ 等少数民族语言对话,服务边疆地区用户
  • DeepSeek V3.2‌:

    • 周调用量超4.6万亿Token‌,中国开源模型榜首‌
    • 稀疏注意力架构‌,长文本处理效率提升50%
    • 代码能力超越GPT-4,兼容OpenAI接口,可无缝替换GPT-4‌
    • 完全开源可商用‌,全球下载量第一
相关推荐
kishu_iOS&AI2 小时前
神经网络 —— 搭建神经网络(实例)
人工智能·深度学习·神经网络
工頁光軍2 小时前
自治智能体矩阵完整架构设计文档
人工智能
盘古信息IMS2 小时前
MES最佳实践|盘古信息IMS赋能傲佑科技打造PCBA一站式电子智造新标杆
大数据·人工智能·科技
ok_hahaha2 小时前
AI从头开始-黑马LongChain-Agent智能体项目-扫地机器人
人工智能
LaughingZhu2 小时前
Product Hunt 每日热榜 | 2026-04-20
前端·数据库·人工智能·经验分享·神经网络
2301_780789662 小时前
游戏盾是如何防护各个重要的游戏端口呢
服务器·网络·人工智能·游戏·架构·零信任
lusasky2 小时前
Vercel生态全家桶及其竞品
人工智能
Lethehong2 小时前
构建高精度智能财经分析工作流:基于 Dify、蓝耘 GLM-5.1 与 Tavily 的实践指南
人工智能·dify·glm·蓝耘元生代·蓝耘maas