同一个模型,三个平台:OpenRouter - SiliconFlow - DeepInfra 实测对比

前面几期测的都是模型官方 API。但你实际用的时候,大概率走的不是官方------而是通过某个聚合平台。

为什么?几个现实原因:

  • 不想每个模型绑一张信用卡
  • 公司采购要求统一结算
  • 官方 API 在某些地区不稳定
  • 想用一个 API Key 调所有模型

所以这期我不测模型了------同一个 DeepSeek V4 Pro,走三个主流聚合平台:OpenRouter、SiliconFlow、DeepInfra。 比价格、延迟、可靠性、文档质量。

先说结论:OpenRouter 最全面,但贵。SiliconFlow 最便宜、中文支持最好。DeepInfra 开源模型最便宜但文档稀烂。


测试设计

参数
测试时间 2026-05-24
测试模型 DeepSeek V4 Pro(同一个模型,三个平台都支持)
任务 5 任务框架(代码生成、Bug 修复、文档注释、SQL 生成、单元测试)
每平台调用数 25 次(5 任务 × 5 轮,测可靠性)
统计指标 价格、首 token 延迟、端到端延迟、错误率、文档可用性

平台简介

平台 一句话 模型数 中国访问
OpenRouter 最大的模型聚合商,支持 300+ 模型 300+ 需翻墙(被墙)
SiliconFlow(硅基流动) 国产平台,中文社区活跃 150+ 直连,国内访问快
DeepInfra 开源模型为主,推理优化好 100+ 直连(偶尔慢)

价格对比

同一模型(DeepSeek V4 Pro),三个平台输入/输出价格(每百万 token):

平台 输入 $/M 输出 $/M vs 官方 额外费用
DeepSeek 官方 $1.74 $3.48 ---
OpenRouter $2.00 $4.00 +15%
SiliconFlow $1.74 $3.48 同价
DeepInfra $2.10 $4.20 +21%

SiliconFlow 跟官方同价------这是最有竞争力的。OpenRouter 加价 15%,DeepInfra 加价 21%。


延迟对比

同一个模型,同样的 prompt,走不同平台的响应速度(5 任务 × 5 轮平均):

平台 首 token 延迟 生成速度 (t/s) 端到端延迟 最差延迟 (P95)
DeepSeek 官方 380ms 48 t/s 12.5s 18.2s
OpenRouter 520ms 45 t/s 14.1s 23.5s
SiliconFlow 360ms 47 t/s 12.3s 16.1s
DeepInfra 610ms 42 t/s 15.8s 29.4s

关键发现

  • SiliconFlow 的延迟比官方还低 20ms------可能因为它在中国有节点,而 DeepSeek 官方服务器也在国内,链路上 SiliconFlow 做了加速。
  • DeepInfra 的延迟最高且最不稳------P95 延迟飙到 29.4s,有一轮 SQL 生成任务等了 30 多秒才出结果。
  • OpenRouter 延迟中规中矩,但如果你在国内且没翻墙,根本连不上。

可靠性:25 次调用错误率

平台 成功 超时 500 错误 限流 (429) 错误率
DeepSeek 官方 25 0 0 0 0%
OpenRouter 24 0 1 0 4%
SiliconFlow 25 0 0 0 0%
DeepInfra 22 2 1 0 12%

DeepInfra 的错误率 12%------25 次调用有 3 次失败。其中 2 次是超时(等了 60s 没返回),1 次是 500 内部错误。这跟我之前的体验一致:DeepInfra 在高峰期(北京时间晚上 9-11 点)稳定性明显下降。

SiliconFlow 25 次全成功,跟官方一样的可靠性。


API 兼容性

维度 OpenRouter SiliconFlow DeepInfra
OpenAI 兼容 ✅ 完整 ✅ 完整 ✅ 基本
Anthropic 兼容 ✅ 完整 ✅ 基本 ❌ 不支持
Streaming
Function Calling ⚠️ 部分模型
思考模式 (thinking) ✅ 透传 ✅ 透传 ❌ 不支持
统一 API Key

如果你用 DeepSeek V4 Pro 的 Anthropic 兼容端点(/v1/messages),SiliconFlow 支持,DeepInfra 不支持。OpenRouter 全部支持,但 Anthropic 端点需要单独配置。


文档质量

维度 OpenRouter SiliconFlow DeepInfra
快速开始 (5 分钟能跑通) ⚠️ 要摸索
中文文档 ❌ 全英文 ✅ 完整中文 ❌ 全英文
错误码说明 ✅ 详细 ✅ 详细 ⚠️ 只有 HTTP 状态码
SDK / 示例代码 ✅ Python/JS/Go ✅ Python/JS ⚠️ 只有 curl
定价透明 ✅ 每个模型标价 ✅ 每个模型标价 ✅ 定价页

OpenRouter 文档最全,但全是英文。SiliconFlow 中文文档写得最好------快速开始 3 分钟就能跑通。DeepInfra 的文档基本是"凑合能用"------需要看源码或社区帖子才能搞明白一些细节。


计费方式

平台 计费方式 起充 发票 余额提醒
OpenRouter 预充值 (Credits) $5
SiliconFlow 预充值 (人民币) ¥10 ✅ 可开票
DeepInfra 预充值 (USD) $10

SiliconFlow 支持人民币充值和开发票------这对公司报销场景非常友好。OpenRouter 和 DeepInfra 都只支持美元,且不开发票。


模型覆盖对比

类型 OpenRouter SiliconFlow DeepInfra
GPT-4o / o4mini 等 ✅ 全部 ❌ 无(合规原因)
Claude 系列 ✅ 全部 ❌ 无
DeepSeek 系列 ✅ V3/V4 ✅ V3
Qwen 系列 ✅ 完整
Llama 系列 ✅ 开源模型最全
Gemini 系列
开源模型(本地蒸馏) 最便宜

SiliconFlow 没有海外闭源模型(GPT/Claude/Gemini),这是合规限制,不是技术问题。如果你的工作流需要用 GPT-4o,SiliconFlow 满足不了。


最终建议

你的情况 选哪个 理由
国内开发者,常用 DeepSeek + Qwen SiliconFlow 跟官方同价、中文文档好、延迟最低
需要同时用 GPT/Claude/DeepSeek/Gemini OpenRouter 唯一能全接的平台
开源模型推理(Llama/Qwen 本地蒸馏) DeepInfra 开源模型最便宜,但稳定性和文档差
公司报销、要发票 SiliconFlow 唯一支持人民币充值和开票
在国外或科学上网下 OpenRouter 生态最全
追求最低延迟 SiliconFlow 或官方直连 聚合平台总有额外一跳

一个提醒:为什么要走聚合平台

有人会问:"聚合平台还贵了,为什么不直接走官方 API?"

理由不是省钱,是运维成本

  1. 你不需要管理 5 个不同的 API Key
  2. 你不需要对接 5 套不同的计费系统
  3. 你不需要处理 5 种不同的错误码
  4. 账单一目了然,方便报销

聚合平台赚的就是这个"统一"的钱。如果你只用 DeepSeek------走官方就行,更便宜。如果你用 3 个以上的模型------聚合平台值得那 15% 的溢价。

相关推荐
Elastic 中国社区官方博客1 小时前
跟踪资金流向:使用 ES|QL 和跨集群搜索追踪洗钱网络
大数据·人工智能·安全·elasticsearch·搜索引擎·金融·全文检索
papership1 小时前
【如何做一个简单的skill(举例详细说明)】
人工智能
长葡萄的叶子2 小时前
什么是RAG?
人工智能
Profile排查笔记2 小时前
指纹浏览器环境异常排查:Fingerprint、Profile、Proxy、Session 和 Task Log 怎么看
前端·人工智能·后端·自动化
水木流年追梦2 小时前
agent面试必备31- AI Agent 核心进阶:工具路由(Tool Routing)
数据库·人工智能·oracle·面试·职场和发展·embedding
Token炼金师2 小时前
目标的抉择:CLM 称王、MLM 退场、FIM 补刀、多 Token 与多语 —— 预训练目标五辩
人工智能·深度学习·预训练·clm·mlm·fim·mtp
星马梦缘2 小时前
机器学习与模式识别 第十三章 从线性模型到神经网络 考点压缩
人工智能·pytorch·神经网络·机器学习·激活函数·relu
one_love_zfl2 小时前
Claude Code 隐私检测事件情况说明及升级指南
人工智能
格子软件2 小时前
2026年分布式GEO代理流量调度:源码级状态机防重挂实战
java·vue.js·人工智能·spring boot·分布式·vue