作者:skyseraph
日期:2026-04-30
原始链接:llm
数据截至 2026-05-01
一、全局概览:两条赛道,一场博弈
大模型套餐市场分化为两种范式:
- 按量计费(API):以 token 为单位付费,适合开发者,成本透明
- 订阅制(Consumer):月付/年付,固定费用解锁配额,适合个人和非技术用户
2026 年最显著的趋势:国产模型在 token 使用量上已全面超越美国。
据 OpenRouter 数据,2026 年 3 月 30 日至 4 月 5 日一周内,中国模型处理 12.96 万亿 tokens ,美国模型仅 3.03 万亿 tokens 。全球 token 消耗量前六名全部来自中国。
二、全球 Token 使用量排行榜
| 排名 | 模型 | 厂商 | 周 Token 量(估算) | 主要优势 |
|---|---|---|---|---|
| 1 | MiMo-V2.5-Pro | 小米 | ~4.79T | 1T 参数 MoE,1M 上下文 |
| 2 | Kimi K2.6 | Moonshot AI | ~1.4T | 编码榜第一,256K 上下文 |
| 3 | DeepSeek-V4-Flash | DeepSeek | 高 | 极低成本,1M 上下文 |
| 4 | Qwen 系列 | 阿里巴巴 | 高 | 多尺寸覆盖,开源生态 |
| 5 | GLM-5 | 智谱 Z.AI | 中高 | 国内首个上市大模型公司旗舰 |
| 6 | Claude Sonnet 4.6 | Anthropic | 中 | SWE-bench 标杆,综合能力领先 |
| 7 | Gemini 3.1 Flash | 中 | 速度快,价格低,多模态 | |
| 8 | GPT-5.5 | OpenAI | 中 | 生态最广,品牌溢价高 |
| 9 | MiniMax-M2.5 | MiniMax | 中 | 音视频多模态领先 |
| 10 | Grok 4 | xAI | 低中 | 实时 X 数据,推理强 |
关键数据
| 时间 | 中国模型 | 美国模型 | 全球总量 |
|---|---|---|---|
| 2025-05(首次超越) | 4.12 万亿 | 2.94 万亿 | --- |
| 2026-03-30 ~ 04-05 | 12.96 万亿 | 3.03 万亿 | 27 万亿 |
中国模型在 OpenRouter 平台占比从 2025 年初 <2% 升至 2026 年 Q2 >45%。DeepSeek 开源份额从 ~80% 降至 ~40%,被 Qwen、MiMo 分流。
三、国内 TOP 5 大模型套餐
3.1 DeepSeek
官网 :chat.deepseek.com · API 文档 :api-docs.deepseek.com · 主体:深度求索(杭州)
DeepSeek 以极低 API 价格和顶级推理能力著称,颠覆美国主导的定价体系。
用户端
| 套餐 | 价格 | 说明 |
|---|---|---|
| 免费版 | ¥0 | 全部功能,含 DeepSeek-V4-Flash 和深度思考 |
| 订阅制 | 无 | 官方不提供消费者月付套餐 |
差异化策略:超低 API 价格服务开发者,消费端完全免费获客。
API 计费(/1M tokens)
| 模型 | 输入 | 缓存命中 | 输出 | 上下文 |
|---|---|---|---|---|
| DeepSeek-V4-Flash | $0.14 | $0.0028 | $0.28 | 1M |
| DeepSeek-V4-Pro(折扣 75%) | $0.435 | $0.003625 | $0.87 | 1M |
| DeepSeek-V4-Pro(原价) | ~$1.74 | --- | ~$3.48 | 1M |
| DeepSeek-V3(旧) | ~$0.20 | --- | --- | 128K |
75% 折扣有效期至 2026-05-05 15:59 UTC,来源:The Next Web
优点:免费版功能完整 · API 价格全球最低之一(比 GPT-5.5 便宜 35-100x)· 开源可本地部署
缺点:无消费者订阅套餐 · 高峰期偶发不稳定 · 无多模态 · 实时信息有限
3.2 Kimi(Moonshot AI)
官网 :kimi.moonshot.cn(国内)/ kimi.com(国际)· 主体:月之暗面(北京)
超长上下文见长(最高 200 万字),知识工作者首选。
用户端
| 套餐 | 月付 | 年付 | 主要权益 |
|---|---|---|---|
| Free | $0 | $0 | 基础对话,有每日限额 |
| 标准套餐 | ~$19 | 更优惠 | 更高频次,优先响应 |
| 高级套餐 | 多档位 | 最高省 $480 | 全部功能,最高配额 |
国内版(人民币):¥0 -- ¥399,以 kimi.moonshot.cn 页面为准。
Kimi Code 开发者套餐
- 输出速度:最高 100 tokens/s
- 5 小时 token 配额,约 300--1,200 次 API 调用
- 最大并发:30
API 计费
| 模型 | 输入/1M | 输出/1M | 上下文 |
|---|---|---|---|
| Kimi K2.6 | $0.60 | $2.50 | 256K |
比 GPT-5.4 便宜 4-17x,比 Claude Sonnet 4.6 便宜 5-6x。
优点:超长上下文(国内最高 2M)· 文档解析强(PDF/Word/Excel)· 编码能力全球前列
缺点:免费版限额严格 · 套餐描述不透明,需登录查看 · 多模态能力较弱
3.3 智谱清言 / GLM(Z.AI)
官网 :chatglm.cn · 开发者平台 :bigmodel.cn / docs.z.ai · 主体:智谱 AI(北京),国内首家上市 AI 大模型公司
GLM-5 于 2026 年 2 月发布,性能达全球前列。
用户端
| 套餐 | 价格 | 说明 |
|---|---|---|
| 免费版 | ¥0 | 基础对话 |
| 会员版 | 官网为准 | 更高配额,优先 GLM-5 |
| GLM Coding Plan | $18/月 | 支持 Claude Code、Cursor、Cline |
面向开发者,性价比最高的 Claude-alternative 订阅之一。来源:GLM Coding Plan 2026
API 计费
| 模型 | 输入/1M | 输出/1M | 上下文 |
|---|---|---|---|
| GLM-5 | $1.00 | $0.20 | 200K |
| GLM-5-Code | 1.20--5.00 | $0.30 | 128K |
| GLM-4.7 | $0.60 | --- | --- |
| GLM-4.5 系列 | 低成本 | --- | --- |
优点:国内合规性最强 · GLM-5 性能全球前列 · Coding Plan 对开发工具支持度高 · 企业级服务体系完整
缺点:消费端套餐不透明 · API 价格高于 DeepSeek · 国际化知名度低 · 低档套餐联网受限
3.4 MiniMax
官网(海螺 AI) :hailuoai.com · 开发者平台 :platform.minimaxi.com · 主体:MiniMax(上海)
音视频多模态能力著称,MiniMax-M2.5 开源运行成本约 $1/小时。
用户端
| 套餐 | 价格 | 说明 |
|---|---|---|
| 免费版 | ¥0 | 基础对话,图像生成有限额 |
| 会员版 | 官网为准 | 更高配额,AI 视频生成 |
以音视频内容创作为核心卖点,适合创意工作者。
API 计费
| 模型 | 输入/1M | 上下文 | 参数 |
|---|---|---|---|
| MiniMax-M2.5 | ~$0.30 | 200K | 230B(10B active MoE) |
优点:音频合成(TTS)和视频生成能力领先 · MoE 架构运行成本极低 · 多模态综合
缺点:纯文本能力略弱于 DeepSeek/Kimi · 品牌知名度低 · 套餐信息更新不及时
3.5 小米 MiMo
官网 :mimo.mi.com · 主体:小米集团
2026 年 token 用量增速最快,V2.5-Pro 以 1.02T 参数 MoE 架构登顶 OpenRouter 周度用量第一。
用户端(TokenPlan)
| 套餐 | 月付 | 说明 |
|---|---|---|
| 入门档 | ¥39/月 | 88% 首购折扣,轻度使用 |
| 进阶档 | 多档位 | 月付/年付,积分制 |
| 企业档 | 定制 | 专属资源,高并发 |
TokenPlan 积分制比传统按次计费更灵活。API 完全兼容 OpenAI 和 Claude 格式。
API 计费
| 模型 | 输入/1M | 上下文 | 特点 |
|---|---|---|---|
| MiMo-V2-Pro | $1.00 | 1M | SWE-Bench 78% |
| MiMo-V2.5-Pro | $1.00 | 1M | OpenRouter 用量第一 |
| MiMo-V2-Flash | 免费(限额) | --- | 开源轻量 |
优点:OpenRouter 用量全球第一(~4.79T)· API 价格极具竞争力 · 1M 超长上下文 · TokenPlan 灵活
缺点:品牌积累时间短 · 消费端产品体验待完善 · 主要优势集中在 API
四、海外 TOP 5 大模型套餐
4.1 ChatGPT(OpenAI)
官网 :chatgpt.com · 定价 :openai.com/chatgpt/pricing
全球用户量最大,2026 年 4 月推出 GPT-5.5,套餐扩展至六档。
订阅套餐
| 套餐 | 月付 | 年付 | 主要功能 |
|---|---|---|---|
| Free | $0 | $0 | GPT-4o-mini,有限额,无图像生成 |
| Go | ~$8 | --- | 轻量付费,休闲用户 |
| Plus | $20 | --- | GPT-5.5,扩展图像生成,优先响应 |
| Pro(低档) | $100 | --- | 更高配额,高级推理模型 |
| Pro(高档) | $200 | --- | 近无限制,全模型访问 |
| Business | $20/seat | 年付 | 管理后台,SAML SSO,数据隐私 |
| Enterprise | 定制 | 定制 | 500+ 人团队,最高合规 |
2026-04 更新:Business 降至 20/seat;Pro 新增 100 入门档;GPT-5.5 成为 Plus 及以上默认模型。
API 计费
| 模型 | 输入/1M | 输出/1M |
|---|---|---|
| GPT-5.5 | $1.75 | $14.00 |
| GPT-5 mini | $0.25 | $2.00 |
| GPT-5 nano | $0.05 | $0.40 |
优点:全球用户量最大,生态最完善(插件、GPT Store)· 套餐灵活,$8 覆盖轻度用户 · GPT-5.5 综合能力强
缺点:$200 Pro 性价比争议大 · API 价格偏高 · 国内需FQ · Plus 高峰期降速
4.2 Claude(Anthropic)
官网 :claude.ai · 定价 :anthropic.com/pricing
代码能力和安全性著称,Claude Code 是 SWE-bench 评分最高工具(~80.9%)。
订阅套餐
| 套餐 | 月付 | 主要功能 |
|---|---|---|
| Free | $0 | 基础对话,无 Claude Code |
| Pro | $20 | 标准配额,含 Claude Code |
| Max 5x | $100 | Pro 的 5 倍配额 |
| Max 20x | $200 | Pro 的 20 倍,Opus 4.6,1M 上下文 |
| Team | $25--30/seat | 最少 2 人,协作,Cowork(2026-01 上线) |
| Enterprise | 定制 | 高合规,专属支持 |
API 计费
| 模型 | 输入/1M | 输出/1M | 上下文 |
|---|---|---|---|
| Claude Opus 4.6 | $5.00 | $25.00 | 1M |
| Claude Sonnet 4.6 | $3.00 | $15.00 | 200K |
| Claude Haiku 4.5 | $1.00 | $5.00 | 200K |
优点:SWE-bench 最高分 · Claude Code 最强终端编码代理 · Max 套餐对重度用户友好
缺点:中文处理弱于国产模型 · $200 Max 价高 · Team 最少 2 人起 · 国内需FQ
4.3 Gemini(Google)
官网 :gemini.google.com · 定价 :one.google.com/about/ai-premium
I/O 2025 重组为三档,并入 Google One 生态,捆绑 YouTube Premium + 2TB 存储。
订阅套餐
| 套餐 | 月付 | 主要功能 |
|---|---|---|
| Free | $0 | 基础版,有限额 |
| Google AI Plus | $7.99 | 入门付费,扩展访问 |
| Google AI Pro | $19.99 | Gemini 3.1 Pro,2M 上下文,2TB 存储,Deep Research,NotebookLM+ |
| Google AI Ultra | $249.99 | 最高配额,Veo 3.1 视频生成,Google Home 集成 |
首月免费试用(新用户)。Google AI Pro = 原 Gemini Advanced / Google One AI Premium。
API 计费
| 模型 | 输入/1M | 输出/1M | 上下文 |
|---|---|---|---|
| Gemini 2.5 Pro | $1.25 | $5.00 | 2M |
| Gemini 3 Flash | $0.50 | $3.00 | 1M |
| Gemini 3.1 Flash Lite | $0.25 | $1.50 | --- |
优点:$19.99 捆绑 2TB + YouTube Premium,综合性价比最高 · 2M 上下文最长 · Google Workspace 深度集成
缺点:$249.99 Ultra 定价激进 · 代码能力不及 Claude · 产品线频繁改名(Bard→Gemini→Google AI)
4.4 Grok(xAI)
官网 :grok.com · 定价 :grok.com/pricing
实时访问 X(Twitter)平台数据,Grok 4 推理能力突出。
独立套餐
| 套餐 | 月付 | 主要功能 |
|---|---|---|
| Free | $0 | 实时 X,Aurora 图像,6 秒视频,语音,Grok 3/4 有限访问 |
| SuperGrok Lite | $10 | 扩展限额 |
| SuperGrok | $30 | 720p HD 视频,30 秒短片,4 个专家 AI 代理 |
| SuperGrok Heavy | $300 | 最高配额,全模型访问 |
X 捆绑套餐
| 套餐 | 月付 | 年付 | Grok 权益 |
|---|---|---|---|
| X Basic | $3 | $32 | 基础访问 |
| X Premium | $8 | $84 | 中等访问 |
| X Premium+ | $40 | $395 | 完整权益 |
企业版:Grok Business 30/seat/月起;SuperGrok Heavy Business 300/seat/月
优点:实时 X 数据独家优势 · Free 档功能慷慨(含视频)· $10 Lite 性价比最高入门
缺点:$300 Heavy 价格虚高 · 与 X 强绑定 · 多模态不及 GPT-5.5/Gemini
4.5 Perplexity AI
官网 :perplexity.ai · 定价 :perplexity.ai/pro
"AI 搜索引擎"定位,实时联网 + 引用溯源,研究型用户首选。
订阅套餐
| 套餐 | 月付 | 年付 | 主要功能 |
|---|---|---|---|
| Free | $0 | $0 | 基础搜索,有限 Pro 次数 |
| Pro | $20 | **200**(≈16.7/月) | 无限 Pro 搜索,可选 GPT/Claude/Gemini,文件上传,API 积分 |
| Enterprise | 定制 | 定制 | SSO,数据隐私,团队管理 |
优点:实时联网,所有答案可溯源 · Pro 可切换后端模型 · 年付 200 是 20 档最实惠 · 学术研究首选
缺点:搜索为核心,代码/创作非强项 · 依赖第三方模型 · Enterprise 价格不透明
五、横向对比总表
5.1 消费者订阅套餐
| 平台 | 免费档 | 入门付费 | 主力 | 旗舰 |
|---|---|---|---|---|
| DeepSeek | ✅ 功能完整 | 无 | 无 | 无 |
| Kimi | ✅ 有限额 | --- | ~$19/月 | 多档 |
| 智谱清言 | ✅ | --- | 官网查看 | --- |
| MiniMax(海螺) | ✅ | --- | 官网查看 | --- |
| MiMo | ✅ | ¥39/月 | 多档 | 企业定制 |
| ChatGPT | ✅ | $8(Go) | $20(Plus) | $100--200(Pro) |
| Claude | ✅ | --- | $20(Pro) | $100--200(Max) |
| Gemini | ✅ | $7.99 | $19.99 | $249.99 |
| Grok | ✅ 功能全 | $10(Lite) | $30 | $300 |
| Perplexity | ✅ | --- | $20 | --- |
5.2 API 价格对比(/1M tokens)
| 模型 | 输入 | 输出 | 上下文 | 性价比 |
|---|---|---|---|---|
| DeepSeek-V4-Flash | $0.14 | $0.28 | 1M | ⭐⭐⭐⭐⭐ |
| MiniMax-M2.5 | $0.30 | --- | 200K | ⭐⭐⭐⭐⭐ |
| Gemini 3.1 Flash Lite | $0.25 | $1.50 | --- | ⭐⭐⭐⭐⭐ |
| Kimi K2.6 | $0.60 | $2.50 | 256K | ⭐⭐⭐⭐ |
| GLM-5 | $1.00 | $0.20 | 200K | ⭐⭐⭐⭐ |
| MiMo-V2.5-Pro | $1.00 | --- | 1M | ⭐⭐⭐⭐ |
| DeepSeek-V4-Pro(折扣) | $0.435 | $0.87 | 1M | ⭐⭐⭐⭐ |
| Gemini 2.5 Pro | $1.25 | $5.00 | 2M | ⭐⭐⭐⭐ |
| GPT-5 mini | $0.25 | $2.00 | --- | ⭐⭐⭐ |
| Claude Haiku 4.5 | $1.00 | $5.00 | 200K | ⭐⭐⭐ |
| Claude Sonnet 4.6 | $3.00 | $15.00 | 200K | ⭐⭐⭐ |
| Claude Opus 4.6 | $5.00 | $25.00 | 1M | ⭐⭐ |
| GPT-5.5 | $1.75 | $14.00 | --- | ⭐⭐ |
5.3 功能维度对比
| 功能 | DeepSeek | Kimi | GLM | MiniMax | MiMo | ChatGPT | Claude | Gemini | Grok | Perplexity |
|---|---|---|---|---|---|---|---|---|---|---|
| 超长上下文(>200K) | ✅1M | ✅2M | ✅200K | ✅200K | ✅1M | ✅部分 | ✅1M | ✅2M | ❌ | ❌ |
| 实时联网搜索 | 有限 | ✅ | ✅ | 有限 | 有限 | ✅ | 有限 | ✅ | ✅X | ✅ |
| 图像生成 | ❌ | 有限 | ✅ | ✅ | 有限 | ✅ | ❌ | ✅ | ✅ | ❌ |
| 视频生成 | ❌ | 有限 | ❌ | ✅ | ❌ | ❌ | ❌ | ✅Veo | ✅ | ❌ |
| 语音模式 | ❌ | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ | ✅ | ✅ | ❌ |
| 代码能力 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐ |
| 中文优化 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ | ⭐⭐ |
| 国内可用 | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ |
| 开源 | ✅ | ❌ | ✅部分 | ✅部分 | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ |
六、隐性成本与弊端
6.1 通用陷阱
- "无限制"水分:所有套餐都有隐性 Rate Limit,高峰期降速。建议实测高峰期响应再决定。
- 上下文窗口 ≠ 有效理解:模型在超长文档的"中间遗忘"现象仍存在,实际可靠长度远低于技术上限。
- 年付退款风险:通常不支持中途退款,模型迭代快,建议先月付观察 1-2 个月再年付。
6.2 国内平台弊端
| 平台 | 主要弊端 |
|---|---|
| DeepSeek | 无订阅制,无多模态;高峰期服务器繁忙;对话历史同步弱 |
| Kimi | 免费额消耗快;付费档不透明需登录查看;长文档摘要偶发幻觉 |
| GLM | 消费端套餐模糊;API 价格偏高;中文开发环境适配有限 |
| MiniMax | 文字能力不及 DeepSeek/Kimi;多模态积分制实际花费高于预期 |
| MiMo | 消费端产品不成熟;TokenPlan 积分制理解门槛高 |
6.3 海外平台弊端
| 平台 | 主要弊端 |
|---|---|
| ChatGPT Plus($20) | 高峰期仍降速;对话记忆弱;国内需FQ+境外支付 |
| ChatGPT Pro($200) | 性价比争议大,$100 新档覆盖大部分场景 |
| Claude Pro($20) | 有每日上限,重度用户易触顶 |
| Claude Max($100--200) | 价高;无法图像/视频;国内无法访问 |
| Gemini Pro($19.99) | Ultra $249.99 定价过高;产品多次改名影响信任 |
| Grok SuperGrok($30) | 依赖 X 生态;$300 Heavy 虚高 |
| Perplexity Pro($20) | 不适合创作/代码;稳定性依赖第三方 |
七、选型建议
场景 → 推荐
| 场景 | 首选 | 备选 |
|---|---|---|
| 个人日常(国内,0 成本) | DeepSeek 免费 | Kimi 免费 |
| 个人日常(海外,$20) | Claude Pro | ChatGPT Plus |
| 超长文档分析 | Kimi 付费 | Gemini Pro |
| AI 编码代理 | Claude Max | DeepSeek API + Claude Code |
| 极致低成本 API | DeepSeek-V4-Flash | MiniMax-M2.5 |
| 研究/实时搜索 | Perplexity Pro | Kimi + 联网 |
| 音视频创作 | MiniMax 会员 | Gemini Pro(Veo) |
| 舆情监控 | Grok SuperGrok | Perplexity Pro |
| 企业级(国内合规) | 智谱 GLM 企业版 | DeepSeek API 私有化 |
| 企业级(海外) | Claude Enterprise | ChatGPT Enterprise |
一句话总结
| 需求 | 推荐 |
|---|---|
| 免费用,功能完整 | DeepSeek(国内) |
| $20 最优性价比 | Claude Pro / Gemini AI Pro |
| 极致低成本 API | DeepSeek-V4-Flash($0.14/1M) |
| 最强代码能力 | Claude + Claude Code |
| 超大上下文 | Kimi (2M)/ Gemini 2.5 Pro(2M) |
| 实时信息搜索 | Perplexity Pro |
| Token 用量增速最快 | MiMo(OpenRouter 第一) |
八、参考资料
Token 使用量
- OpenRouter Rankings
- OpenRouter 2025 State of AI Report
- Global Times - Chinese AI Models Take Top Six
- KuCoin - China Weekly Usage Surpasses US
- People's Daily - Chinese AI Models Gain Global Use
国内平台定价
- DeepSeek API Pricing
- DeepSeek V4-Pro 75% Price Cut
- Kimi Membership Pricing
- Kimi K2.6 API Pricing
- Z.AI Developer Docs - Pricing
- GLM Coding Plan 2026
- MiniMax-M2.5 on HuggingFace
- Xiaomi MiMo TokenPlan
海外平台定价
- ChatGPT Pricing 2026
- OpenAI 官方定价
- Claude AI Pricing 2026
- Anthropic 官方定价
- Gemini Pricing
- Grok Pricing Guide 2026
- AI Cloud Subscriptions 2026
- AI API Pricing Comparison 2026
