前面几期测的都是模型官方 API。但你实际用的时候,大概率走的不是官方------而是通过某个聚合平台。
为什么?几个现实原因:
- 不想每个模型绑一张信用卡
- 公司采购要求统一结算
- 官方 API 在某些地区不稳定
- 想用一个 API Key 调所有模型
所以这期我不测模型了------同一个 DeepSeek V4 Pro,走三个主流聚合平台:OpenRouter、SiliconFlow、DeepInfra。 比价格、延迟、可靠性、文档质量。
先说结论:OpenRouter 最全面,但贵。SiliconFlow 最便宜、中文支持最好。DeepInfra 开源模型最便宜但文档稀烂。
测试设计
| 参数 | 值 |
|---|---|
| 测试时间 | 2026-05-24 |
| 测试模型 | DeepSeek V4 Pro(同一个模型,三个平台都支持) |
| 任务 | 5 任务框架(代码生成、Bug 修复、文档注释、SQL 生成、单元测试) |
| 每平台调用数 | 25 次(5 任务 × 5 轮,测可靠性) |
| 统计指标 | 价格、首 token 延迟、端到端延迟、错误率、文档可用性 |
平台简介
| 平台 | 一句话 | 模型数 | 中国访问 |
|---|---|---|---|
| OpenRouter | 最大的模型聚合商,支持 300+ 模型 | 300+ | 需翻墙(被墙) |
| SiliconFlow(硅基流动) | 国产平台,中文社区活跃 | 150+ | 直连,国内访问快 |
| DeepInfra | 开源模型为主,推理优化好 | 100+ | 直连(偶尔慢) |
价格对比
同一模型(DeepSeek V4 Pro),三个平台输入/输出价格(每百万 token):
| 平台 | 输入 $/M | 输出 $/M | vs 官方 | 额外费用 |
|---|---|---|---|---|
| DeepSeek 官方 | $1.74 | $3.48 | --- | 无 |
| OpenRouter | $2.00 | $4.00 | +15% | 无 |
| SiliconFlow | $1.74 | $3.48 | 同价 | 无 |
| DeepInfra | $2.10 | $4.20 | +21% | 无 |
SiliconFlow 跟官方同价------这是最有竞争力的。OpenRouter 加价 15%,DeepInfra 加价 21%。
延迟对比
同一个模型,同样的 prompt,走不同平台的响应速度(5 任务 × 5 轮平均):
| 平台 | 首 token 延迟 | 生成速度 (t/s) | 端到端延迟 | 最差延迟 (P95) |
|---|---|---|---|---|
| DeepSeek 官方 | 380ms | 48 t/s | 12.5s | 18.2s |
| OpenRouter | 520ms | 45 t/s | 14.1s | 23.5s |
| SiliconFlow | 360ms | 47 t/s | 12.3s | 16.1s |
| DeepInfra | 610ms | 42 t/s | 15.8s | 29.4s |
关键发现:
- SiliconFlow 的延迟比官方还低 20ms------可能因为它在中国有节点,而 DeepSeek 官方服务器也在国内,链路上 SiliconFlow 做了加速。
- DeepInfra 的延迟最高且最不稳------P95 延迟飙到 29.4s,有一轮 SQL 生成任务等了 30 多秒才出结果。
- OpenRouter 延迟中规中矩,但如果你在国内且没翻墙,根本连不上。
可靠性:25 次调用错误率
| 平台 | 成功 | 超时 | 500 错误 | 限流 (429) | 错误率 |
|---|---|---|---|---|---|
| DeepSeek 官方 | 25 | 0 | 0 | 0 | 0% |
| OpenRouter | 24 | 0 | 1 | 0 | 4% |
| SiliconFlow | 25 | 0 | 0 | 0 | 0% |
| DeepInfra | 22 | 2 | 1 | 0 | 12% |
DeepInfra 的错误率 12%------25 次调用有 3 次失败。其中 2 次是超时(等了 60s 没返回),1 次是 500 内部错误。这跟我之前的体验一致:DeepInfra 在高峰期(北京时间晚上 9-11 点)稳定性明显下降。
SiliconFlow 25 次全成功,跟官方一样的可靠性。
API 兼容性
| 维度 | OpenRouter | SiliconFlow | DeepInfra |
|---|---|---|---|
| OpenAI 兼容 | ✅ 完整 | ✅ 完整 | ✅ 基本 |
| Anthropic 兼容 | ✅ 完整 | ✅ 基本 | ❌ 不支持 |
| Streaming | ✅ | ✅ | ✅ |
| Function Calling | ✅ | ✅ | ⚠️ 部分模型 |
| 思考模式 (thinking) | ✅ 透传 | ✅ 透传 | ❌ 不支持 |
| 统一 API Key | ✅ | ✅ | ✅ |
如果你用 DeepSeek V4 Pro 的 Anthropic 兼容端点(/v1/messages),SiliconFlow 支持,DeepInfra 不支持。OpenRouter 全部支持,但 Anthropic 端点需要单独配置。
文档质量
| 维度 | OpenRouter | SiliconFlow | DeepInfra |
|---|---|---|---|
| 快速开始 (5 分钟能跑通) | ✅ | ✅ | ⚠️ 要摸索 |
| 中文文档 | ❌ 全英文 | ✅ 完整中文 | ❌ 全英文 |
| 错误码说明 | ✅ 详细 | ✅ 详细 | ⚠️ 只有 HTTP 状态码 |
| SDK / 示例代码 | ✅ Python/JS/Go | ✅ Python/JS | ⚠️ 只有 curl |
| 定价透明 | ✅ 每个模型标价 | ✅ 每个模型标价 | ✅ 定价页 |
OpenRouter 文档最全,但全是英文。SiliconFlow 中文文档写得最好------快速开始 3 分钟就能跑通。DeepInfra 的文档基本是"凑合能用"------需要看源码或社区帖子才能搞明白一些细节。
计费方式
| 平台 | 计费方式 | 起充 | 发票 | 余额提醒 |
|---|---|---|---|---|
| OpenRouter | 预充值 (Credits) | $5 | 无 | ✅ |
| SiliconFlow | 预充值 (人民币) | ¥10 | ✅ 可开票 | ✅ |
| DeepInfra | 预充值 (USD) | $10 | ❌ | ❌ |
SiliconFlow 支持人民币充值和开发票------这对公司报销场景非常友好。OpenRouter 和 DeepInfra 都只支持美元,且不开发票。
模型覆盖对比
| 类型 | OpenRouter | SiliconFlow | DeepInfra |
|---|---|---|---|
| GPT-4o / o4mini 等 | ✅ 全部 | ❌ 无(合规原因) | ❌ |
| Claude 系列 | ✅ 全部 | ❌ 无 | ❌ |
| DeepSeek 系列 | ✅ | ✅ V3/V4 | ✅ V3 |
| Qwen 系列 | ✅ | ✅ 完整 | ✅ |
| Llama 系列 | ✅ | ✅ | ✅ 开源模型最全 |
| Gemini 系列 | ✅ | ❌ | ❌ |
| 开源模型(本地蒸馏) | ✅ | ✅ | ✅ 最便宜 |
SiliconFlow 没有海外闭源模型(GPT/Claude/Gemini),这是合规限制,不是技术问题。如果你的工作流需要用 GPT-4o,SiliconFlow 满足不了。
最终建议
| 你的情况 | 选哪个 | 理由 |
|---|---|---|
| 国内开发者,常用 DeepSeek + Qwen | SiliconFlow | 跟官方同价、中文文档好、延迟最低 |
| 需要同时用 GPT/Claude/DeepSeek/Gemini | OpenRouter | 唯一能全接的平台 |
| 开源模型推理(Llama/Qwen 本地蒸馏) | DeepInfra | 开源模型最便宜,但稳定性和文档差 |
| 公司报销、要发票 | SiliconFlow | 唯一支持人民币充值和开票 |
| 在国外或科学上网下 | OpenRouter | 生态最全 |
| 追求最低延迟 | SiliconFlow 或官方直连 | 聚合平台总有额外一跳 |
一个提醒:为什么要走聚合平台
有人会问:"聚合平台还贵了,为什么不直接走官方 API?"
理由不是省钱,是运维成本:
- 你不需要管理 5 个不同的 API Key
- 你不需要对接 5 套不同的计费系统
- 你不需要处理 5 种不同的错误码
- 账单一目了然,方便报销
聚合平台赚的就是这个"统一"的钱。如果你只用 DeepSeek------走官方就行,更便宜。如果你用 3 个以上的模型------聚合平台值得那 15% 的溢价。