AI API 聚合网关怎么选：价格、接入配置与团队管控实测

用 Claude Code、Codex、Cursor 写代码，绑外币卡和多平台管理是两个绕不开的问题。这篇记录我实测几种 AI API 接入方案的过程，包括官方直连、自建网关、第三方聚合平台的价格对比和配置踩坑。

为什么需要聚合网关

天天用 Claude Code、Codex、Cursor 写代码，两件事让我头疼：

一是绑卡。OpenAI 要一张，Anthropic 要一张，Google 又要一张，都是外币卡，有的还挑卡段。二是管理。三个平台三套 Key、三套用量面板、三套账单，团队几个人一起用的时候更乱。

所以我开始看"聚合网关"这条路------用一个统一的 OpenAI 兼容接口，后面帮你转发到各家 API。目前主流的方案大概三类：

国内聚合平台 ：人民币计价，国内网络直连，不用绑外币卡。缺点是多了一层中间商，数据经过第三方。这类平台不少，我这次挑了一家叫「微元算力」的试了三周，下面的价格和配置数据都来自这家。

海外聚合平台 ：比如 OpenRouter，模型覆盖广，社区活跃。但它本身就是美元计价，还是要外币卡，而且国内网络访问不太稳定，等于没解决我的核心痛点。

自建开源方案 ：比如 one-api、new-api，自己部署一个网关服务，配好上游渠道，Key 管理和负载均衡都自己搞。优点是数据完全可控、不多一层中间商；缺点是要自己运维、上游渠道还是得自己去各家开号绑卡，并没有省掉绑卡这一步。适合有运维能力且对数据安全要求高的团队。

价格对比

这是我最关心的部分。下面的数据是我对着后台一条条抄的，按 token 计费，单位是人民币每百万 token。

主力模型定价

模型	输入(¥/百万 token)	输出(¥/百万 token)	缓存读取(¥/百万 token)
claude-opus-4-7	10.5	52.5	1.05
claude-opus-4-7-thinking	11.76	58.8	1.176
claude-opus-4-8	10.5	52.5	1.05
claude-sonnet-4-6	6.3	31.5	0.63
claude-haiku-4-5	4.2	21.0	0.42
gpt-5.5	2.4	19.2	0.24
gpt-5.4	2.0	16.0	0.2
gpt-5.4-mini	0.6	4.8	---
gemini-3.1-pro-preview	8.0	32.0	---
gemini-3.5-flash	8.0	32.0	---
gemini-2.5-pro	4.0	32.0	---
deepseek-v4-pro	4.2	8.4	---
deepseek-v4-flash	0.525	1.05	---

跟官方价算一下

Claude 是我日常主力，重点算这个。Anthropic 官方定价：

claude-opus-4-7	输入	输出	缓存读取
官方价($/百万 token)	5	25	0.5
聚合平台(¥/百万 token)	10.5	52.5	1.05
人民币 ÷ 美元	2.1	2.1	2.1

三个价位全部 2.1 倍，即官方美元数字乘以 2.1 当人民币价。真实汇率 ¥7.3 ≈ $1，直连官方同样的调用得花 5×7.3=¥36.5，这边 ¥10.5，大概官方价的三成。

便宜是便宜，但本质上是聚合平台的定价策略。它们拿到的上游价格（批量账号、Bedrock 预留实例之类）比零售低，但具体低多少、利润多少，外面人不知道。这一点所有聚合平台都一样，包括 OpenRouter 的部分模型定价也低于官方零售价。

作为对比：OpenRouter 上 Claude Opus 4.7 标价 $5/5/$ 5/25（和官方一样），但它有 arena 模式和部分模型的折扣通道；自建 one-api 的成本取决于你上游渠道拿到什么价格，如果走 AWS Bedrock 预留实例，长期看可能更便宜，但前期投入大。

1 块钱能买多少 token

模型	价格输入/输出(¥/百万)	¥1 买的输入 token	¥1 买的输出 token
gpt-5.4	2.0 / 16.0	约 50 万	约 6.25 万
gpt-5.4-mini	0.6 / 4.8	约 167 万	约 20.8 万
claude-opus-4-7	10.5 / 52.5	约 9.5 万	约 1.9 万
claude-sonnet-4-6	6.3 / 31.5	约 15.9 万	约 3.2 万
deepseek-v4-flash	0.525 / 1.05	约 190 万	约 95 万

日常调试用 Sonnet 或 Haiku 就够了，Opus 留给复杂推理。缓存读取只要输入价的十分之一，Claude Code 那种长系统提示词的场景，缓存命中后成本能降一个数量级。

接入配置实操

不管用哪家聚合平台，接入方式都差不多------OpenAI 标准协议，改个 Base URL 和 Key。下面贴几个常用工具的配置，YOUR_BASE_URL 换成你实际用的网关地址。

基本验证：

bash 复制代码

curl ${YOUR_BASE_URL}/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-你的Key" \
  -d '{
    "model": "claude-opus-4-7",
    "messages": [{"role": "user", "content": "写一个快速排序"}]
  }'

Claude Code

改 ~/.claude/settings.json：

json 复制代码

{
  "env": {
    "ANTHROPIC_BASE_URL": "${YOUR_BASE_URL}",
    "ANTHROPIC_AUTH_TOKEN": "sk-你的Key"
  }
}

注意 Base URL 不带 /v1 后缀，这个容易搞错。

Codex CLI

在 ~/.codex/ 下建两个文件。config.toml：

toml 复制代码

model_provider = "custom"
model = "gpt-5.4"
model_reasoning_effort = "xhigh"
network_access = "enabled"
disable_response_storage = true

[model_providers.custom]
name = "custom"
base_url = "${YOUR_BASE_URL}/v1"
wire_api = "responses"
requires_openai_auth = true

auth.json：

json 复制代码

{
  "OPENAI_API_KEY": "sk-你的Key"
}

Gemini CLI

改 ~/.gemini/.env，设 GOOGLE_GEMINI_BASE_URL=${YOUR_BASE_URL}，模型用 gemini-3.1-pro-preview。

Cursor

Settings → Models 里 Override OpenAI Base URL，填 ${YOUR_BASE_URL}/v1，再填 Key 和模型名。

Python

python 复制代码

from openai import OpenAI

client = OpenAI(
    api_key="sk-你的Key",
    base_url="${YOUR_BASE_URL}/v1"
)

response = client.chat.completions.create(
    model="claude-opus-4-7",
    messages=[{"role": "user", "content": "Hello!"}]
)
print(response.choices[0].message.content)

踩过的坑

报 Invalid API Key 大概率是 Base URL 没改对，先跑一下 curl ${YOUR_BASE_URL}/v1/models 验证连通性。

另外一个常见问题：有些聚合平台的模型名跟官方不完全一致，比如 claude-3-5-sonnet 和 claude-3-5-sonnet-20241022 可能是不同的模型映射。调不通先看文档确认模型名。

稳定性和数据安全

先说我自己的体感：用了大概三周，Claude 系列的调用成功率还行，偶尔会有几秒的延迟波动，但没遇到长时间不可用的情况。GPT 系列偶尔会返回 rate limit 错误，估计是上游的号池不够，等一会儿再试就好了。

这其实是所有聚合平台的通病------你的请求多了一跳，延迟和错误率天然比直连高。自建 one-api 也一样，上游渠道挂了你也得等。区别在于自建的话你能看到是哪个渠道挂了，第三方平台你只能等它恢复。

数据安全方面，说实在话，你用任何第三方聚合平台都得信它那句"不存 Prompt"------你没法审计它后端到底存没存。这一点不分国内国外，OpenRouter 也一样。如果调用内容涉及真正敏感的商业机密，建议直连官方 API 或者走企业版合同。日常写代码、做个人项目、跑实验，问题不大。

团队管控：一个被忽视的刚需

这块我多说几句，因为之前我们组吃过亏。

五六个人共用一把 Key，月底谁用了多少全靠猜，有人离职了 Key 还在跑，想禁用都不知道该禁哪个。这不是某个平台的问题，而是"团队用 API"这个场景天然需要管控。

自建 one-api / new-api 在这方面做得不错，支持多用户、多渠道、按用户设配额，但你得自己部署运维。

第三方聚合平台里，我试的这家有个企业管理后台，我进去看了一圈：

三级角色（所有者/管理员/成员），权限分得比较清楚：

功能	所有者	管理员	成员
数据看板	✅	✅	❌
成员管理	✅	✅	❌
配额与模型限制	✅	✅	❌
审计日志	✅	✅	❌
全部令牌管理	✅	✅	❌
个人令牌	✅	✅	✅
IP 白名单	✅	❌	❌

几个对我有用的点：给每个人设额度上限，限制可用模型（实习生用 Haiku 就够了），人走了一键禁用。IP 白名单分两层（企业级 + 令牌级），Key 泄露了但 IP 不在白名单里就调不了。

不过跟真正的企业级 API 管理平台（Kong、Apigee）比，颗粒度还是差不少。没有按部门分层级、没有审批流、没有跟内部 SSO 对接。几十人以上的团队可能还是得在上面再包一层自己的管控。

三种方案怎么选

维度	自建 one-api	海外聚合（OpenRouter）	国内聚合平台
绑外币卡	需要（上游渠道）	需要	不需要
国内网络	取决于部署位置	不稳定	直连
数据可控性	完全可控	第三方	第三方
运维成本	高（自己部署维护）	无	无
团队管控	内置（需配置）	有限	内置
价格	取决于上游渠道	接近官方	低于官方
适合场景	有运维能力、数据敏感	不在意网络和币种	国内团队、个人开发者

我个人的选择：日常开发调试用国内聚合平台（省事），涉及敏感数据的项目直连官方 API。如果团队有专职运维且调用量大，自建 one-api 长期成本最低。

踩坑总结

聚合平台的文档普遍比较散，模型参数支持情况（function calling、vision 的具体限制）经常得自己试。
价格调整不一定有提前通知，定期看账单比看公告靠谱。
不同平台对模型名的映射可能不一致，调不通先确认模型名拼写。
Base URL 带不带 /v1 后缀因工具而异，Claude Code 不带，OpenAI SDK 带，搞混了就是 Invalid API Key。
聚合平台的 rate limit 策略不透明，高并发场景建议做好重试和降级逻辑。

没有完美的方案，只有适合当前阶段的方案。先搞清楚自己最在意什么（价格、稳定性、数据安全、运维成本），再选路线。