大模型套餐深度分析:国内外主流平台全景对比

作者:skyseraph

日期:2026-04-30

原始链接:llm

数据截至 2026-05-01


一、全局概览:两条赛道,一场博弈

大模型套餐市场分化为两种范式:

  • 按量计费(API):以 token 为单位付费,适合开发者,成本透明
  • 订阅制(Consumer):月付/年付,固定费用解锁配额,适合个人和非技术用户

2026 年最显著的趋势:国产模型在 token 使用量上已全面超越美国。

据 OpenRouter 数据,2026 年 3 月 30 日至 4 月 5 日一周内,中国模型处理 12.96 万亿 tokens ,美国模型仅 3.03 万亿 tokens 。全球 token 消耗量前六名全部来自中国


二、全球 Token 使用量排行榜

数据来源:OpenRouter Rankings · OpenRouter 2025 State of AI

排名 模型 厂商 周 Token 量(估算) 主要优势
1 MiMo-V2.5-Pro 小米 ~4.79T 1T 参数 MoE,1M 上下文
2 Kimi K2.6 Moonshot AI ~1.4T 编码榜第一,256K 上下文
3 DeepSeek-V4-Flash DeepSeek 极低成本,1M 上下文
4 Qwen 系列 阿里巴巴 多尺寸覆盖,开源生态
5 GLM-5 智谱 Z.AI 中高 国内首个上市大模型公司旗舰
6 Claude Sonnet 4.6 Anthropic SWE-bench 标杆,综合能力领先
7 Gemini 3.1 Flash Google 速度快,价格低,多模态
8 GPT-5.5 OpenAI 生态最广,品牌溢价高
9 MiniMax-M2.5 MiniMax 音视频多模态领先
10 Grok 4 xAI 低中 实时 X 数据,推理强

关键数据

时间 中国模型 美国模型 全球总量
2025-05(首次超越) 4.12 万亿 2.94 万亿 ---
2026-03-30 ~ 04-05 12.96 万亿 3.03 万亿 27 万亿

中国模型在 OpenRouter 平台占比从 2025 年初 <2% 升至 2026 年 Q2 >45%。DeepSeek 开源份额从 ~80% 降至 ~40%,被 Qwen、MiMo 分流。


三、国内 TOP 5 大模型套餐

3.1 DeepSeek

官网chat.deepseek.com · API 文档api-docs.deepseek.com · 主体:深度求索(杭州)

DeepSeek 以极低 API 价格和顶级推理能力著称,颠覆美国主导的定价体系。

用户端

套餐 价格 说明
免费版 ¥0 全部功能,含 DeepSeek-V4-Flash 和深度思考
订阅制 官方不提供消费者月付套餐

差异化策略:超低 API 价格服务开发者,消费端完全免费获客。

API 计费(/1M tokens)

模型 输入 缓存命中 输出 上下文
DeepSeek-V4-Flash $0.14 $0.0028 $0.28 1M
DeepSeek-V4-Pro(折扣 75%) $0.435 $0.003625 $0.87 1M
DeepSeek-V4-Pro(原价) ~$1.74 --- ~$3.48 1M
DeepSeek-V3(旧) ~$0.20 --- --- 128K

75% 折扣有效期至 2026-05-05 15:59 UTC,来源:The Next Web

优点:免费版功能完整 · API 价格全球最低之一(比 GPT-5.5 便宜 35-100x)· 开源可本地部署

缺点:无消费者订阅套餐 · 高峰期偶发不稳定 · 无多模态 · 实时信息有限


3.2 Kimi(Moonshot AI)

官网kimi.moonshot.cn(国内)/ kimi.com(国际)· 主体:月之暗面(北京)

超长上下文见长(最高 200 万字),知识工作者首选。

用户端

套餐 月付 年付 主要权益
Free $0 $0 基础对话,有每日限额
标准套餐 ~$19 更优惠 更高频次,优先响应
高级套餐 多档位 最高省 $480 全部功能,最高配额

国内版(人民币):¥0 -- ¥399,以 kimi.moonshot.cn 页面为准。

Kimi Code 开发者套餐

  • 输出速度:最高 100 tokens/s
  • 5 小时 token 配额,约 300--1,200 次 API 调用
  • 最大并发:30

API 计费

模型 输入/1M 输出/1M 上下文
Kimi K2.6 $0.60 $2.50 256K

比 GPT-5.4 便宜 4-17x,比 Claude Sonnet 4.6 便宜 5-6x。

优点:超长上下文(国内最高 2M)· 文档解析强(PDF/Word/Excel)· 编码能力全球前列

缺点:免费版限额严格 · 套餐描述不透明,需登录查看 · 多模态能力较弱


3.3 智谱清言 / GLM(Z.AI

官网chatglm.cn · 开发者平台bigmodel.cn / docs.z.ai · 主体:智谱 AI(北京),国内首家上市 AI 大模型公司

GLM-5 于 2026 年 2 月发布,性能达全球前列。

用户端

套餐 价格 说明
免费版 ¥0 基础对话
会员版 官网为准 更高配额,优先 GLM-5
GLM Coding Plan $18/月 支持 Claude Code、Cursor、Cline

面向开发者,性价比最高的 Claude-alternative 订阅之一。来源:GLM Coding Plan 2026

API 计费

模型 输入/1M 输出/1M 上下文
GLM-5 $1.00 $0.20 200K
GLM-5-Code 1.20--5.00 $0.30 128K
GLM-4.7 $0.60 --- ---
GLM-4.5 系列 低成本 --- ---

优点:国内合规性最强 · GLM-5 性能全球前列 · Coding Plan 对开发工具支持度高 · 企业级服务体系完整

缺点:消费端套餐不透明 · API 价格高于 DeepSeek · 国际化知名度低 · 低档套餐联网受限


3.4 MiniMax

官网(海螺 AI)hailuoai.com · 开发者平台platform.minimaxi.com · 主体:MiniMax(上海)

音视频多模态能力著称,MiniMax-M2.5 开源运行成本约 $1/小时

用户端

套餐 价格 说明
免费版 ¥0 基础对话,图像生成有限额
会员版 官网为准 更高配额,AI 视频生成

以音视频内容创作为核心卖点,适合创意工作者。

API 计费

模型 输入/1M 上下文 参数
MiniMax-M2.5 ~$0.30 200K 230B(10B active MoE)

优点:音频合成(TTS)和视频生成能力领先 · MoE 架构运行成本极低 · 多模态综合

缺点:纯文本能力略弱于 DeepSeek/Kimi · 品牌知名度低 · 套餐信息更新不及时


3.5 小米 MiMo

官网mimo.mi.com · 主体:小米集团

2026 年 token 用量增速最快,V2.5-Pro 以 1.02T 参数 MoE 架构登顶 OpenRouter 周度用量第一。

用户端(TokenPlan)

套餐 月付 说明
入门档 ¥39/月 88% 首购折扣,轻度使用
进阶档 多档位 月付/年付,积分制
企业档 定制 专属资源,高并发

TokenPlan 积分制比传统按次计费更灵活。API 完全兼容 OpenAI 和 Claude 格式。

API 计费

模型 输入/1M 上下文 特点
MiMo-V2-Pro $1.00 1M SWE-Bench 78%
MiMo-V2.5-Pro $1.00 1M OpenRouter 用量第一
MiMo-V2-Flash 免费(限额) --- 开源轻量

优点:OpenRouter 用量全球第一(~4.79T)· API 价格极具竞争力 · 1M 超长上下文 · TokenPlan 灵活

缺点:品牌积累时间短 · 消费端产品体验待完善 · 主要优势集中在 API


四、海外 TOP 5 大模型套餐

4.1 ChatGPT(OpenAI)

官网chatgpt.com · 定价openai.com/chatgpt/pricing

全球用户量最大,2026 年 4 月推出 GPT-5.5,套餐扩展至六档。

订阅套餐

套餐 月付 年付 主要功能
Free $0 $0 GPT-4o-mini,有限额,无图像生成
Go ~$8 --- 轻量付费,休闲用户
Plus $20 --- GPT-5.5,扩展图像生成,优先响应
Pro(低档) $100 --- 更高配额,高级推理模型
Pro(高档) $200 --- 近无限制,全模型访问
Business $20/seat 年付 管理后台,SAML SSO,数据隐私
Enterprise 定制 定制 500+ 人团队,最高合规

2026-04 更新:Business 降至 20/seat;Pro 新增 100 入门档;GPT-5.5 成为 Plus 及以上默认模型。

API 计费

模型 输入/1M 输出/1M
GPT-5.5 $1.75 $14.00
GPT-5 mini $0.25 $2.00
GPT-5 nano $0.05 $0.40

优点:全球用户量最大,生态最完善(插件、GPT Store)· 套餐灵活,$8 覆盖轻度用户 · GPT-5.5 综合能力强

缺点:$200 Pro 性价比争议大 · API 价格偏高 · 国内需FQ · Plus 高峰期降速


4.2 Claude(Anthropic)

官网claude.ai · 定价anthropic.com/pricing

代码能力和安全性著称,Claude Code 是 SWE-bench 评分最高工具(~80.9%)。

订阅套餐

套餐 月付 主要功能
Free $0 基础对话,无 Claude Code
Pro $20 标准配额,含 Claude Code
Max 5x $100 Pro 的 5 倍配额
Max 20x $200 Pro 的 20 倍,Opus 4.6,1M 上下文
Team $25--30/seat 最少 2 人,协作,Cowork(2026-01 上线)
Enterprise 定制 高合规,专属支持

API 计费

模型 输入/1M 输出/1M 上下文
Claude Opus 4.6 $5.00 $25.00 1M
Claude Sonnet 4.6 $3.00 $15.00 200K
Claude Haiku 4.5 $1.00 $5.00 200K

优点:SWE-bench 最高分 · Claude Code 最强终端编码代理 · Max 套餐对重度用户友好

缺点:中文处理弱于国产模型 · $200 Max 价高 · Team 最少 2 人起 · 国内需FQ


4.3 Gemini(Google)

官网gemini.google.com · 定价one.google.com/about/ai-premium

I/O 2025 重组为三档,并入 Google One 生态,捆绑 YouTube Premium + 2TB 存储。

订阅套餐

套餐 月付 主要功能
Free $0 基础版,有限额
Google AI Plus $7.99 入门付费,扩展访问
Google AI Pro $19.99 Gemini 3.1 Pro,2M 上下文,2TB 存储,Deep Research,NotebookLM+
Google AI Ultra $249.99 最高配额,Veo 3.1 视频生成,Google Home 集成

首月免费试用(新用户)。Google AI Pro = 原 Gemini Advanced / Google One AI Premium。

API 计费

模型 输入/1M 输出/1M 上下文
Gemini 2.5 Pro $1.25 $5.00 2M
Gemini 3 Flash $0.50 $3.00 1M
Gemini 3.1 Flash Lite $0.25 $1.50 ---

优点:$19.99 捆绑 2TB + YouTube Premium,综合性价比最高 · 2M 上下文最长 · Google Workspace 深度集成

缺点:$249.99 Ultra 定价激进 · 代码能力不及 Claude · 产品线频繁改名(Bard→Gemini→Google AI)


4.4 Grok(xAI)

官网grok.com · 定价grok.com/pricing

实时访问 X(Twitter)平台数据,Grok 4 推理能力突出。

独立套餐

套餐 月付 主要功能
Free $0 实时 X,Aurora 图像,6 秒视频,语音,Grok 3/4 有限访问
SuperGrok Lite $10 扩展限额
SuperGrok $30 720p HD 视频,30 秒短片,4 个专家 AI 代理
SuperGrok Heavy $300 最高配额,全模型访问

X 捆绑套餐

套餐 月付 年付 Grok 权益
X Basic $3 $32 基础访问
X Premium $8 $84 中等访问
X Premium+ $40 $395 完整权益

企业版:Grok Business 30/seat/月起;SuperGrok Heavy Business 300/seat/月

优点:实时 X 数据独家优势 · Free 档功能慷慨(含视频)· $10 Lite 性价比最高入门

缺点:$300 Heavy 价格虚高 · 与 X 强绑定 · 多模态不及 GPT-5.5/Gemini


4.5 Perplexity AI

官网perplexity.ai · 定价perplexity.ai/pro

"AI 搜索引擎"定位,实时联网 + 引用溯源,研究型用户首选。

订阅套餐

套餐 月付 年付 主要功能
Free $0 $0 基础搜索,有限 Pro 次数
Pro $20 **200**(≈16.7/月) 无限 Pro 搜索,可选 GPT/Claude/Gemini,文件上传,API 积分
Enterprise 定制 定制 SSO,数据隐私,团队管理

优点:实时联网,所有答案可溯源 · Pro 可切换后端模型 · 年付 200 是 20 档最实惠 · 学术研究首选

缺点:搜索为核心,代码/创作非强项 · 依赖第三方模型 · Enterprise 价格不透明


五、横向对比总表

5.1 消费者订阅套餐

平台 免费档 入门付费 主力 旗舰
DeepSeek ✅ 功能完整
Kimi ✅ 有限额 --- ~$19/月 多档
智谱清言 --- 官网查看 ---
MiniMax(海螺) --- 官网查看 ---
MiMo ¥39/月 多档 企业定制
ChatGPT $8(Go) $20(Plus) $100--200(Pro)
Claude --- $20(Pro) $100--200(Max)
Gemini $7.99 $19.99 $249.99
Grok ✅ 功能全 $10(Lite) $30 $300
Perplexity --- $20 ---

5.2 API 价格对比(/1M tokens)

模型 输入 输出 上下文 性价比
DeepSeek-V4-Flash $0.14 $0.28 1M ⭐⭐⭐⭐⭐
MiniMax-M2.5 $0.30 --- 200K ⭐⭐⭐⭐⭐
Gemini 3.1 Flash Lite $0.25 $1.50 --- ⭐⭐⭐⭐⭐
Kimi K2.6 $0.60 $2.50 256K ⭐⭐⭐⭐
GLM-5 $1.00 $0.20 200K ⭐⭐⭐⭐
MiMo-V2.5-Pro $1.00 --- 1M ⭐⭐⭐⭐
DeepSeek-V4-Pro(折扣) $0.435 $0.87 1M ⭐⭐⭐⭐
Gemini 2.5 Pro $1.25 $5.00 2M ⭐⭐⭐⭐
GPT-5 mini $0.25 $2.00 --- ⭐⭐⭐
Claude Haiku 4.5 $1.00 $5.00 200K ⭐⭐⭐
Claude Sonnet 4.6 $3.00 $15.00 200K ⭐⭐⭐
Claude Opus 4.6 $5.00 $25.00 1M ⭐⭐
GPT-5.5 $1.75 $14.00 --- ⭐⭐

5.3 功能维度对比

功能 DeepSeek Kimi GLM MiniMax MiMo ChatGPT Claude Gemini Grok Perplexity
超长上下文(>200K) ✅1M ✅2M ✅200K ✅200K ✅1M ✅部分 ✅1M ✅2M
实时联网搜索 有限 有限 有限 有限 ✅X
图像生成 有限 有限
视频生成 有限 ✅Veo
语音模式
代码能力 ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐
中文优化 ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐ ⭐⭐ ⭐⭐
国内可用
开源 ✅部分 ✅部分

六、隐性成本与弊端

6.1 通用陷阱

  • "无限制"水分:所有套餐都有隐性 Rate Limit,高峰期降速。建议实测高峰期响应再决定。
  • 上下文窗口 ≠ 有效理解:模型在超长文档的"中间遗忘"现象仍存在,实际可靠长度远低于技术上限。
  • 年付退款风险:通常不支持中途退款,模型迭代快,建议先月付观察 1-2 个月再年付。

6.2 国内平台弊端

平台 主要弊端
DeepSeek 无订阅制,无多模态;高峰期服务器繁忙;对话历史同步弱
Kimi 免费额消耗快;付费档不透明需登录查看;长文档摘要偶发幻觉
GLM 消费端套餐模糊;API 价格偏高;中文开发环境适配有限
MiniMax 文字能力不及 DeepSeek/Kimi;多模态积分制实际花费高于预期
MiMo 消费端产品不成熟;TokenPlan 积分制理解门槛高

6.3 海外平台弊端

平台 主要弊端
ChatGPT Plus($20) 高峰期仍降速;对话记忆弱;国内需FQ+境外支付
ChatGPT Pro($200) 性价比争议大,$100 新档覆盖大部分场景
Claude Pro($20) 有每日上限,重度用户易触顶
Claude Max($100--200) 价高;无法图像/视频;国内无法访问
Gemini Pro($19.99) Ultra $249.99 定价过高;产品多次改名影响信任
Grok SuperGrok($30) 依赖 X 生态;$300 Heavy 虚高
Perplexity Pro($20) 不适合创作/代码;稳定性依赖第三方

七、选型建议

场景 → 推荐

场景 首选 备选
个人日常(国内,0 成本) DeepSeek 免费 Kimi 免费
个人日常(海外,$20) Claude Pro ChatGPT Plus
超长文档分析 Kimi 付费 Gemini Pro
AI 编码代理 Claude Max DeepSeek API + Claude Code
极致低成本 API DeepSeek-V4-Flash MiniMax-M2.5
研究/实时搜索 Perplexity Pro Kimi + 联网
音视频创作 MiniMax 会员 Gemini Pro(Veo)
舆情监控 Grok SuperGrok Perplexity Pro
企业级(国内合规) 智谱 GLM 企业版 DeepSeek API 私有化
企业级(海外) Claude Enterprise ChatGPT Enterprise

一句话总结

需求 推荐
免费用,功能完整 DeepSeek(国内)
$20 最优性价比 Claude Pro / Gemini AI Pro
极致低成本 API DeepSeek-V4-Flash($0.14/1M)
最强代码能力 Claude + Claude Code
超大上下文 Kimi (2M)/ Gemini 2.5 Pro(2M)
实时信息搜索 Perplexity Pro
Token 用量增速最快 MiMo(OpenRouter 第一)

八、参考资料

Token 使用量

国内平台定价

海外平台定价

相关推荐
稚枭天卓5 小时前
大模型评测网站合集
llm
怪我冷i7 小时前
如何在VsCode中安装Golang插件
golang·llm
钟智强9 小时前
DeepSeek-R1 V3.2 V4架构训练推理性能实测分析,企业私有化部署选型对照表
ai·架构·llm·deepseek
研究点啥好呢1 天前
高德多模态算法工程师面试题精选:10道高频考题+答案解析
python·面试·llm·求职招聘·笔试·高德
程序设计实验室1 天前
用本地大模型驱动中文输入法,我做了一个实验性的项目
ai·llm
怪我冷i1 天前
多租户管理系统,用户表,IsSuperAdmin,IsTenantAdmin,IsCompanyAdmin,IsDeptAdmin需要吗?
golang·llm·多租户·skill
测试员周周1 天前
【AI测试系统】第2篇:拒绝盲目 AI:规则引擎 10ms 自动生成 36 条测试用例实战(附源码)
llm·ai编程·测试
冬奇Lab1 天前
RAG 系列(三):调对这 4 个参数,让你的 RAG 从「能用」变「好用」
人工智能·llm
数据智能老司机1 天前
人人都能学会的提示词工程——人人都能学会的提示词工程
llm