大模型套餐深度分析：国内外主流平台全景对比

作者：skyseraph

日期：2026-04-30

原始链接：llm

数据截至 2026-05-01

一、全局概览：两条赛道，一场博弈

大模型套餐市场分化为两种范式：

按量计费（API）：以 token 为单位付费，适合开发者，成本透明
订阅制（Consumer）：月付/年付，固定费用解锁配额，适合个人和非技术用户

2026 年最显著的趋势：国产模型在 token 使用量上已全面超越美国。

据 OpenRouter 数据，2026 年 3 月 30 日至 4 月 5 日一周内，中国模型处理 12.96 万亿 tokens ，美国模型仅 3.03 万亿 tokens 。全球 token 消耗量前六名全部来自中国。

二、全球 Token 使用量排行榜

数据来源：OpenRouter Rankings · OpenRouter 2025 State of AI

排名	模型	厂商	周 Token 量（估算）	主要优势
1	MiMo-V2.5-Pro	小米	~4.79T	1T 参数 MoE，1M 上下文
2	Kimi K2.6	Moonshot AI	~1.4T	编码榜第一，256K 上下文
3	DeepSeek-V4-Flash	DeepSeek	高	极低成本，1M 上下文
4	Qwen 系列	阿里巴巴	高	多尺寸覆盖，开源生态
5	GLM-5	智谱 Z.AI	中高	国内首个上市大模型公司旗舰
6	Claude Sonnet 4.6	Anthropic	中	SWE-bench 标杆，综合能力领先
7	Gemini 3.1 Flash	Google	中	速度快，价格低，多模态
8	GPT-5.5	OpenAI	中	生态最广，品牌溢价高
9	MiniMax-M2.5	MiniMax	中	音视频多模态领先
10	Grok 4	xAI	低中	实时 X 数据，推理强

关键数据

时间	中国模型	美国模型	全球总量
2025-05（首次超越）	4.12 万亿	2.94 万亿	---
2026-03-30 ~ 04-05	12.96 万亿	3.03 万亿	27 万亿

中国模型在 OpenRouter 平台占比从 2025 年初 <2% 升至 2026 年 Q2 >45%。DeepSeek 开源份额从 ~80% 降至 ~40%，被 Qwen、MiMo 分流。

三、国内 TOP 5 大模型套餐

3.1 DeepSeek

官网：chat.deepseek.com · API 文档 ：api-docs.deepseek.com · 主体：深度求索（杭州）

DeepSeek 以极低 API 价格和顶级推理能力著称，颠覆美国主导的定价体系。

用户端

套餐	价格	说明
免费版	¥0	全部功能，含 DeepSeek-V4-Flash 和深度思考
订阅制	无	官方不提供消费者月付套餐

差异化策略：超低 API 价格服务开发者，消费端完全免费获客。

API 计费（/1M tokens）

模型	输入	缓存命中	输出	上下文
DeepSeek-V4-Flash	$0.14	$0.0028	$0.28	1M
DeepSeek-V4-Pro（折扣 75%）	$0.435	$0.003625	$0.87	1M
DeepSeek-V4-Pro（原价）	~$1.74	---	~$3.48	1M
DeepSeek-V3（旧）	~$0.20	---	---	128K

75% 折扣有效期至 2026-05-05 15:59 UTC，来源：The Next Web

优点：免费版功能完整 · API 价格全球最低之一（比 GPT-5.5 便宜 35-100x）· 开源可本地部署

缺点：无消费者订阅套餐 · 高峰期偶发不稳定 · 无多模态 · 实时信息有限

3.2 Kimi（Moonshot AI）

官网：kimi.moonshot.cn（国内）/ kimi.com（国际）· 主体：月之暗面（北京）

超长上下文见长（最高 200 万字），知识工作者首选。

用户端

套餐	月付	年付	主要权益
Free	$0	$0	基础对话，有每日限额
标准套餐	~$19	更优惠	更高频次，优先响应
高级套餐	多档位	最高省 $480	全部功能，最高配额

国内版（人民币）：¥0 -- ¥399，以 kimi.moonshot.cn 页面为准。

Kimi Code 开发者套餐

输出速度：最高 100 tokens/s
5 小时 token 配额，约 300--1,200 次 API 调用
最大并发：30

API 计费

模型	输入/1M	输出/1M	上下文
Kimi K2.6	$0.60	$2.50	256K

比 GPT-5.4 便宜 4-17x，比 Claude Sonnet 4.6 便宜 5-6x。

优点：超长上下文（国内最高 2M）· 文档解析强（PDF/Word/Excel）· 编码能力全球前列

缺点：免费版限额严格 · 套餐描述不透明，需登录查看 · 多模态能力较弱

3.3 智谱清言 / GLM（Z.AI）

官网：chatglm.cn · 开发者平台 ：bigmodel.cn / docs.z.ai · 主体：智谱 AI（北京），国内首家上市 AI 大模型公司

GLM-5 于 2026 年 2 月发布，性能达全球前列。

用户端

套餐	价格	说明
免费版	¥0	基础对话
会员版	官网为准	更高配额，优先 GLM-5
GLM Coding Plan	$18/月	支持 Claude Code、Cursor、Cline

面向开发者，性价比最高的 Claude-alternative 订阅之一。来源：GLM Coding Plan 2026

API 计费

模型	输入/1M	输出/1M	上下文
GLM-5	$1.00	$0.20	200K
GLM-5-Code	$1.20--$ 5.00	$0.30	128K
GLM-4.7	$0.60	---	---
GLM-4.5 系列	低成本	---	---

优点：国内合规性最强 · GLM-5 性能全球前列 · Coding Plan 对开发工具支持度高 · 企业级服务体系完整

缺点：消费端套餐不透明 · API 价格高于 DeepSeek · 国际化知名度低 · 低档套餐联网受限

3.4 MiniMax

官网（海螺 AI） ：hailuoai.com · 开发者平台 ：platform.minimaxi.com · 主体：MiniMax（上海）

音视频多模态能力著称，MiniMax-M2.5 开源运行成本约 $1/小时。

用户端

套餐	价格	说明
免费版	¥0	基础对话，图像生成有限额
会员版	官网为准	更高配额，AI 视频生成

以音视频内容创作为核心卖点，适合创意工作者。

API 计费

模型	输入/1M	上下文	参数
MiniMax-M2.5	~$0.30	200K	230B（10B active MoE）

优点：音频合成（TTS）和视频生成能力领先 · MoE 架构运行成本极低 · 多模态综合

缺点：纯文本能力略弱于 DeepSeek/Kimi · 品牌知名度低 · 套餐信息更新不及时

3.5 小米 MiMo

官网：mimo.mi.com · 主体：小米集团

2026 年 token 用量增速最快，V2.5-Pro 以 1.02T 参数 MoE 架构登顶 OpenRouter 周度用量第一。

用户端（TokenPlan）

套餐	月付	说明
入门档	¥39/月	88% 首购折扣，轻度使用
进阶档	多档位	月付/年付，积分制
企业档	定制	专属资源，高并发

TokenPlan 积分制比传统按次计费更灵活。API 完全兼容 OpenAI 和 Claude 格式。

API 计费

模型	输入/1M	上下文	特点
MiMo-V2-Pro	$1.00	1M	SWE-Bench 78%
MiMo-V2.5-Pro	$1.00	1M	OpenRouter 用量第一
MiMo-V2-Flash	免费（限额）	---	开源轻量

优点：OpenRouter 用量全球第一（~4.79T）· API 价格极具竞争力 · 1M 超长上下文 · TokenPlan 灵活

缺点：品牌积累时间短 · 消费端产品体验待完善 · 主要优势集中在 API

四、海外 TOP 5 大模型套餐

4.1 ChatGPT（OpenAI）

官网：chatgpt.com · 定价：openai.com/chatgpt/pricing

全球用户量最大，2026 年 4 月推出 GPT-5.5，套餐扩展至六档。

订阅套餐

套餐	月付	年付	主要功能
Free	$0	$0	GPT-4o-mini，有限额，无图像生成
Go	~$8	---	轻量付费，休闲用户
Plus	$20	---	GPT-5.5，扩展图像生成，优先响应
Pro（低档）	$100	---	更高配额，高级推理模型
Pro（高档）	$200	---	近无限制，全模型访问
Business	$20/seat	年付	管理后台，SAML SSO，数据隐私
Enterprise	定制	定制	500+ 人团队，最高合规

2026-04 更新：Business 降至 $20/seat；Pro 新增$ 100 入门档；GPT-5.5 成为 Plus 及以上默认模型。

API 计费

模型	输入/1M	输出/1M
GPT-5.5	$1.75	$14.00
GPT-5 mini	$0.25	$2.00
GPT-5 nano	$0.05	$0.40

优点：全球用户量最大，生态最完善（插件、GPT Store）· 套餐灵活，$8 覆盖轻度用户 · GPT-5.5 综合能力强

缺点：$200 Pro 性价比争议大 · API 价格偏高 · 国内需FQ · Plus 高峰期降速

4.2 Claude（Anthropic）

官网：claude.ai · 定价：anthropic.com/pricing

代码能力和安全性著称，Claude Code 是 SWE-bench 评分最高工具（~80.9%）。

订阅套餐

套餐	月付	主要功能
Free	$0	基础对话，无 Claude Code
Pro	$20	标准配额，含 Claude Code
Max 5x	$100	Pro 的 5 倍配额
Max 20x	$200	Pro 的 20 倍，Opus 4.6，1M 上下文
Team	$25--30/seat	最少 2 人，协作，Cowork（2026-01 上线）
Enterprise	定制	高合规，专属支持

API 计费

模型	输入/1M	输出/1M	上下文
Claude Opus 4.6	$5.00	$25.00	1M
Claude Sonnet 4.6	$3.00	$15.00	200K
Claude Haiku 4.5	$1.00	$5.00	200K

优点：SWE-bench 最高分 · Claude Code 最强终端编码代理 · Max 套餐对重度用户友好

缺点：中文处理弱于国产模型 · $200 Max 价高 · Team 最少 2 人起 · 国内需FQ

4.3 Gemini（Google）

官网：gemini.google.com · 定价：one.google.com/about/ai-premium

I/O 2025 重组为三档，并入 Google One 生态，捆绑 YouTube Premium + 2TB 存储。

订阅套餐

套餐	月付	主要功能
Free	$0	基础版，有限额
Google AI Plus	$7.99	入门付费，扩展访问
Google AI Pro	$19.99	Gemini 3.1 Pro，2M 上下文，2TB 存储，Deep Research，NotebookLM+
Google AI Ultra	$249.99	最高配额，Veo 3.1 视频生成，Google Home 集成

首月免费试用（新用户）。Google AI Pro = 原 Gemini Advanced / Google One AI Premium。

API 计费

模型	输入/1M	输出/1M	上下文
Gemini 2.5 Pro	$1.25	$5.00	2M
Gemini 3 Flash	$0.50	$3.00	1M
Gemini 3.1 Flash Lite	$0.25	$1.50	---

优点：$19.99 捆绑 2TB + YouTube Premium，综合性价比最高 · 2M 上下文最长 · Google Workspace 深度集成

缺点：$249.99 Ultra 定价激进 · 代码能力不及 Claude · 产品线频繁改名（Bard→Gemini→Google AI）

4.4 Grok（xAI）

官网：grok.com · 定价：grok.com/pricing

实时访问 X（Twitter）平台数据，Grok 4 推理能力突出。

独立套餐

套餐	月付	主要功能
Free	$0	实时 X，Aurora 图像，6 秒视频，语音，Grok 3/4 有限访问
SuperGrok Lite	$10	扩展限额
SuperGrok	$30	720p HD 视频，30 秒短片，4 个专家 AI 代理
SuperGrok Heavy	$300	最高配额，全模型访问

X 捆绑套餐

套餐	月付	年付	Grok 权益
X Basic	$3	$32	基础访问
X Premium	$8	$84	中等访问
X Premium+	$40	$395	完整权益

企业版：Grok Business $30/seat/月起；SuperGrok Heavy Business$ 300/seat/月

优点：实时 X 数据独家优势 · Free 档功能慷慨（含视频）· $10 Lite 性价比最高入门

缺点：$300 Heavy 价格虚高 · 与 X 强绑定 · 多模态不及 GPT-5.5/Gemini

4.5 Perplexity AI

官网：perplexity.ai · 定价：perplexity.ai/pro

"AI 搜索引擎"定位，实时联网 + 引用溯源，研究型用户首选。

订阅套餐

套餐	月付	年付	主要功能
Free	$0	$0	基础搜索，有限 Pro 次数
Pro	$20	$200（\approx$ 16.7/月）	无限 Pro 搜索，可选 GPT/Claude/Gemini，文件上传，API 积分
Enterprise	定制	定制	SSO，数据隐私，团队管理

优点：实时联网，所有答案可溯源 · Pro 可切换后端模型 · 年付 $200 是$ 20 档最实惠 · 学术研究首选

缺点：搜索为核心，代码/创作非强项 · 依赖第三方模型 · Enterprise 价格不透明

五、横向对比总表

5.1 消费者订阅套餐

平台	免费档	入门付费	主力	旗舰
DeepSeek	✅ 功能完整	无	无	无
Kimi	✅ 有限额	---	~$19/月	多档
智谱清言	✅	---	官网查看	---
MiniMax（海螺）	✅	---	官网查看	---
MiMo	✅	¥39/月	多档	企业定制
ChatGPT	✅	$8（Go）	$20（Plus）	$100--200（Pro）
Claude	✅	---	$20（Pro）	$100--200（Max）
Gemini	✅	$7.99	$19.99	$249.99
Grok	✅ 功能全	$10（Lite）	$30	$300
Perplexity	✅	---	$20	---

5.2 API 价格对比（/1M tokens）

模型	输入	输出	上下文	性价比
DeepSeek-V4-Flash	$0.14	$0.28	1M	⭐⭐⭐⭐⭐
MiniMax-M2.5	$0.30	---	200K	⭐⭐⭐⭐⭐
Gemini 3.1 Flash Lite	$0.25	$1.50	---	⭐⭐⭐⭐⭐
Kimi K2.6	$0.60	$2.50	256K	⭐⭐⭐⭐
GLM-5	$1.00	$0.20	200K	⭐⭐⭐⭐
MiMo-V2.5-Pro	$1.00	---	1M	⭐⭐⭐⭐
DeepSeek-V4-Pro（折扣）	$0.435	$0.87	1M	⭐⭐⭐⭐
Gemini 2.5 Pro	$1.25	$5.00	2M	⭐⭐⭐⭐
GPT-5 mini	$0.25	$2.00	---	⭐⭐⭐
Claude Haiku 4.5	$1.00	$5.00	200K	⭐⭐⭐
Claude Sonnet 4.6	$3.00	$15.00	200K	⭐⭐⭐
Claude Opus 4.6	$5.00	$25.00	1M	⭐⭐
GPT-5.5	$1.75	$14.00	---	⭐⭐

5.3 功能维度对比

功能	DeepSeek	Kimi	GLM	MiniMax	MiMo	ChatGPT	Claude	Gemini	Grok	Perplexity
超长上下文（>200K）	✅1M	✅2M	✅200K	✅200K	✅1M	✅部分	✅1M	✅2M	❌	❌
实时联网搜索	有限	✅	✅	有限	有限	✅	有限	✅	✅X	✅
图像生成	❌	有限	✅	✅	有限	✅	❌	✅	✅	❌
视频生成	❌	有限	❌	✅	❌	❌	❌	✅Veo	✅	❌
语音模式	❌	✅	✅	✅	❌	✅	❌	✅	✅	❌
代码能力	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐
中文优化	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐	⭐⭐
国内可用	✅	✅	✅	✅	✅	❌	❌	❌	❌	❌
开源	✅	❌	✅部分	✅部分	✅	❌	❌	❌	❌	❌

六、隐性成本与弊端

6.1 通用陷阱

"无限制"水分：所有套餐都有隐性 Rate Limit，高峰期降速。建议实测高峰期响应再决定。
上下文窗口 ≠ 有效理解：模型在超长文档的"中间遗忘"现象仍存在，实际可靠长度远低于技术上限。
年付退款风险：通常不支持中途退款，模型迭代快，建议先月付观察 1-2 个月再年付。

6.2 国内平台弊端

平台	主要弊端
DeepSeek	无订阅制，无多模态；高峰期服务器繁忙；对话历史同步弱
Kimi	免费额消耗快；付费档不透明需登录查看；长文档摘要偶发幻觉
GLM	消费端套餐模糊；API 价格偏高；中文开发环境适配有限
MiniMax	文字能力不及 DeepSeek/Kimi；多模态积分制实际花费高于预期
MiMo	消费端产品不成熟；TokenPlan 积分制理解门槛高

6.3 海外平台弊端

平台	主要弊端
ChatGPT Plus（$20）	高峰期仍降速；对话记忆弱；国内需FQ+境外支付
ChatGPT Pro（$200）	性价比争议大，$100 新档覆盖大部分场景
Claude Pro（$20）	有每日上限，重度用户易触顶
Claude Max（$100--200）	价高；无法图像/视频；国内无法访问
Gemini Pro（$19.99）	Ultra $249.99 定价过高；产品多次改名影响信任
Grok SuperGrok（$30）	依赖 X 生态；$300 Heavy 虚高
Perplexity Pro（$20）	不适合创作/代码；稳定性依赖第三方

七、选型建议

场景 → 推荐

场景	首选	备选
个人日常（国内，0 成本）	DeepSeek 免费	Kimi 免费
个人日常（海外，$20）	Claude Pro	ChatGPT Plus
超长文档分析	Kimi 付费	Gemini Pro
AI 编码代理	Claude Max	DeepSeek API + Claude Code
极致低成本 API	DeepSeek-V4-Flash	MiniMax-M2.5
研究/实时搜索	Perplexity Pro	Kimi + 联网
音视频创作	MiniMax 会员	Gemini Pro（Veo）
舆情监控	Grok SuperGrok	Perplexity Pro
企业级（国内合规）	智谱 GLM 企业版	DeepSeek API 私有化
企业级（海外）	Claude Enterprise	ChatGPT Enterprise

一句话总结

需求	推荐
免费用，功能完整	DeepSeek（国内）
$20 最优性价比	Claude Pro / Gemini AI Pro
极致低成本 API	DeepSeek-V4-Flash（$0.14/1M）
最强代码能力	Claude + Claude Code
超大上下文	Kimi （2M）/ Gemini 2.5 Pro（2M）
实时信息搜索	Perplexity Pro
Token 用量增速最快	MiMo（OpenRouter 第一）

八、参考资料

Token 使用量

国内平台定价

海外平台定价