小米 MiMo vs DeepSeek API 选型对比

- 一、先看结论：按量同价，套餐相当于预付费折扣
- [二、小米 Token Plan](#二、小米 Token Plan)
- - 套餐档次
  - [各模型 Credit 消耗](#各模型 Credit 消耗)
  - 和按量比，省多少？
- 三、模型能力对比
- - 功能特性
  - 并发限制
- 四、场景化选型
- 五、需要注意的事
- - [DeepSeek 已永久降价](#DeepSeek 已永久降价)
  - 小米限时政策
- 六、最终结论

2026年5月，小米和DeepSeek先后宣布API永久降价。按量计费上两家价格完全一致，小米Token Plan相当于预付费充值，高档次可享约8折优惠。真正的差异在于多模态、并发能力、输出长度等功能特性。

一、先看结论：按量同价，套餐相当于预付费折扣

两家在按量计费上打成了平手------输入输出价格一模一样。小米Token Plan本质是预付费充值，Lite约95折，Max约8折。DeepSeek目前没有套餐方案。

按量价格（元/百万tokens）：

模型级别	小米	DeepSeek
Pro级（缓存命中/未命中/输出）	¥0.025 / ¥3 / ¥6	¥0.025 / ¥3 / ¥6
标准级（缓存命中/未命中/输出）	¥0.02 / ¥1 / ¥2	¥0.02 / ¥1 / ¥2

价格完全一致，不用纠结选哪家。

二、小米 Token Plan

套餐档次

套餐	月费	固定Credit额度	纯输出等值Token（mimo-v2.5）	95%缓存命中场景可用Token
Lite	¥39	41亿	0.205亿	0.5亿+
Standard	¥99	110亿	0.55亿	1.3亿+
Pro	¥329	380亿	1.9亿	4.7亿+
Max	¥659	820亿	4.1亿	10亿+

注：纯输出等值Token是按输出价格（200 Credits/Token）换算的理论值；95%缓存命中场景可用Token来自官方数据（缓存命中仅消耗2 Credits/Token），实际可用量约为纯输出口径的 24~48倍。

各模型 Credit 消耗

模型	缓存命中	未命中	输出
mimo-v2.5-pro	2.5	300	600
mimo-v2.5	2	100	200
mimo-v2-pro	140	700	2100
mimo-v2-omni	56	280	1400

选 mimo-v2.5 最划算------缓存命中时每Token只消耗 2 Credits。

和按量比，省多少？

以 mimo-v2.5 输出为例（按量 ¥2/百万tokens）：

套餐	月费	Credits 等值金额	折扣力度
Lite	¥39	¥41	约95折
Standard	¥99	¥110	约9折
Pro	¥329	¥380	约86折
Max	¥659	¥820	约8折

套餐本质是预付费充值，档次越高折扣越大。缓存命中率高时（消耗仅2 Credits/Token），同等Credits可处理更多Token。

三、模型能力对比

功能特性

维度	小米 mimo-v2.5-pro	小米 mimo-v2.5	DeepSeek v4-pro	DeepSeek v4-flash
上下文窗口	1M	1M	1M	1M
最大输出	128K	128K	384K	384K
深度思考	✅	✅	✅	✅
函数调用	✅	✅	✅	✅
结构化输出	✅	✅	✅	✅
联网搜索	✅	✅	❌	❌
全模态理解	❌	✅	❌	❌

关键差异：

输出长度：DeepSeek 是小米的 3 倍（384K vs 128K），长文本生成有明显优势
多模态：小米 mimo-v2.5 支持全模态理解，DeepSeek 暂不支持（V4.1 预计 6 月推出）
联网搜索：小米原生支持，DeepSeek API 本身不提供原生联网搜索

并发限制

平台	限制	数值
小米	最大 RPM	100
小米	最大 TPM	10M
DeepSeek v4-pro	并发	500
DeepSeek v4-flash	并发	2,500

高并发场景 DeepSeek 优势明显，v4-flash 2,500 并发远超小米的 100 RPM。

四、场景化选型

场景	推荐方案	理由
高输入+高缓存命中（代码分析、长文档理解）	小米 Token Plan (Standard 或 Pro)	缓存命中仅 2 Credits/Token，套餐折扣叠加高命中优势，比按量省约 20%
低输入+高输出（纯对话生成）	按量计费（任选一家）	输出消耗 200 Credits/Token，套餐折扣有限，按量更灵活
高并发应用	DeepSeek v4-flash	2,500 并发
长文本生成	DeepSeek v4-pro	384K 输出
多模态 / 联网搜索	小米 mimo-v2.5	唯一支持
用量不稳定 / 初创测试	按量（任选一家）	灵活无门槛

五、需要注意的事

DeepSeek 已永久降价

DeepSeek V4-Pro 在 5月22日 已将 2.5 折优惠转为永久价格，当前价格就是最终价格。

小米限时政策

缓存写入：限时免费，未来可能收费
联网搜索：按调用次数独立计费（国内 ¥25/1000次），不含在Token价格中；搜索返回的网页内容会拼接为输入Token，按模型标准价格计费
Token Plan 额度：用不完不结转，按需选择档次

MiMo-V2-Pro 和 MiMo-V2-Omni 即将下线，尽快迁移至 V2.5 系列。

六、最终结论

你的优先级	选
预付费折扣 + 稳定用量	小米 Token Plan（高档次折扣更大）
高并发 + 大规模	DeepSeek v4-flash
长输出	DeepSeek v4-pro
多模态 / 联网搜索	小米 mimo-v2.5
用量不确定 / 初创测试	任选一家按量计费

一句话：按量计费两家完全一致，选谁看功能需求。需要高并发或长输出选 DeepSeek，需要多模态或联网搜索选小米。

本文价格数据基于 2026年5月27日官方公开信息整理，实际价格请以各平台官方文档为准。API定价可能随时调整，建议使用前再次确认。