目录
2026年5月,小米和DeepSeek先后宣布API永久降价。按量计费上两家价格完全一致,小米Token Plan相当于预付费充值,高档次可享约8折优惠。真正的差异在于多模态、并发能力、输出长度等功能特性。
一、先看结论:按量同价,套餐相当于预付费折扣

两家在按量计费上打成了平手------输入输出价格一模一样。小米Token Plan本质是预付费充值,Lite约95折,Max约8折。DeepSeek目前没有套餐方案。
按量价格(元/百万tokens):
| 模型级别 | 小米 | DeepSeek |
|---|---|---|
| Pro级(缓存命中/未命中/输出) | ¥0.025 / ¥3 / ¥6 | ¥0.025 / ¥3 / ¥6 |
| 标准级(缓存命中/未命中/输出) | ¥0.02 / ¥1 / ¥2 | ¥0.02 / ¥1 / ¥2 |
价格完全一致,不用纠结选哪家。
二、小米 Token Plan
套餐档次

| 套餐 | 月费 | 固定Credit额度 | 纯输出等值Token(mimo-v2.5) | 95%缓存命中场景可用Token |
|---|---|---|---|---|
| Lite | ¥39 | 41亿 | 0.205亿 | 0.5亿+ |
| Standard | ¥99 | 110亿 | 0.55亿 | 1.3亿+ |
| Pro | ¥329 | 380亿 | 1.9亿 | 4.7亿+ |
| Max | ¥659 | 820亿 | 4.1亿 | 10亿+ |
注 :纯输出等值Token是按输出价格(200 Credits/Token)换算的理论值;95%缓存命中场景可用Token来自官方数据(缓存命中仅消耗2 Credits/Token),实际可用量约为纯输出口径的 24~48倍。
各模型 Credit 消耗
| 模型 | 缓存命中 | 未命中 | 输出 |
|---|---|---|---|
| mimo-v2.5-pro | 2.5 | 300 | 600 |
| mimo-v2.5 | 2 | 100 | 200 |
| mimo-v2-pro | 140 | 700 | 2100 |
| mimo-v2-omni | 56 | 280 | 1400 |
选 mimo-v2.5 最划算------缓存命中时每Token只消耗 2 Credits。
和按量比,省多少?
以 mimo-v2.5 输出为例(按量 ¥2/百万tokens):
| 套餐 | 月费 | Credits 等值金额 | 折扣力度 |
|---|---|---|---|
| Lite | ¥39 | ¥41 | 约95折 |
| Standard | ¥99 | ¥110 | 约9折 |
| Pro | ¥329 | ¥380 | 约86折 |
| Max | ¥659 | ¥820 | 约8折 |
套餐本质是预付费充值,档次越高折扣越大。缓存命中率高时(消耗仅2 Credits/Token),同等Credits可处理更多Token。
三、模型能力对比
功能特性
| 维度 | 小米 mimo-v2.5-pro | 小米 mimo-v2.5 | DeepSeek v4-pro | DeepSeek v4-flash |
|---|---|---|---|---|
| 上下文窗口 | 1M | 1M | 1M | 1M |
| 最大输出 | 128K | 128K | 384K | 384K |
| 深度思考 | ✅ | ✅ | ✅ | ✅ |
| 函数调用 | ✅ | ✅ | ✅ | ✅ |
| 结构化输出 | ✅ | ✅ | ✅ | ✅ |
| 联网搜索 | ✅ | ✅ | ❌ | ❌ |
| 全模态理解 | ❌ | ✅ | ❌ | ❌ |
关键差异:
- 输出长度:DeepSeek 是小米的 3 倍(384K vs 128K),长文本生成有明显优势
- 多模态:小米 mimo-v2.5 支持全模态理解,DeepSeek 暂不支持(V4.1 预计 6 月推出)
- 联网搜索:小米原生支持,DeepSeek API 本身不提供原生联网搜索
并发限制
| 平台 | 限制 | 数值 |
|---|---|---|
| 小米 | 最大 RPM | 100 |
| 小米 | 最大 TPM | 10M |
| DeepSeek v4-pro | 并发 | 500 |
| DeepSeek v4-flash | 并发 | 2,500 |
高并发场景 DeepSeek 优势明显,v4-flash 2,500 并发远超小米的 100 RPM。
四、场景化选型
| 场景 | 推荐方案 | 理由 |
|---|---|---|
| 高输入+高缓存命中(代码分析、长文档理解) | 小米 Token Plan (Standard 或 Pro) | 缓存命中仅 2 Credits/Token,套餐折扣叠加高命中优势,比按量省约 20% |
| 低输入+高输出(纯对话生成) | 按量计费(任选一家) | 输出消耗 200 Credits/Token,套餐折扣有限,按量更灵活 |
| 高并发应用 | DeepSeek v4-flash | 2,500 并发 |
| 长文本生成 | DeepSeek v4-pro | 384K 输出 |
| 多模态 / 联网搜索 | 小米 mimo-v2.5 | 唯一支持 |
| 用量不稳定 / 初创测试 | 按量(任选一家) | 灵活无门槛 |
五、需要注意的事
DeepSeek 已永久降价
DeepSeek V4-Pro 在 5月22日 已将 2.5 折优惠转为永久价格,当前价格就是最终价格。
小米限时政策
- 缓存写入:限时免费,未来可能收费
- 联网搜索:按调用次数独立计费(国内 ¥25/1000次),不含在Token价格中;搜索返回的网页内容会拼接为输入Token,按模型标准价格计费
- Token Plan 额度:用不完不结转,按需选择档次
MiMo-V2-Pro 和 MiMo-V2-Omni 即将下线,尽快迁移至 V2.5 系列。
六、最终结论
| 你的优先级 | 选 |
|---|---|
| 预付费折扣 + 稳定用量 | 小米 Token Plan(高档次折扣更大) |
| 高并发 + 大规模 | DeepSeek v4-flash |
| 长输出 | DeepSeek v4-pro |
| 多模态 / 联网搜索 | 小米 mimo-v2.5 |
| 用量不确定 / 初创测试 | 任选一家按量计费 |
一句话:按量计费两家完全一致,选谁看功能需求。需要高并发或长输出选 DeepSeek,需要多模态或联网搜索选小米。
本文价格数据基于 2026年5月27日官方公开信息整理,实际价格请以各平台官方文档为准。API定价可能随时调整,建议使用前再次确认。