Claude Code 模型接入阿里云 AI 网关并统计不同使用者的模型用量

1. 目标

将 Claude Code 通过阿里云 AI 网关纳管，实现多模型统一接入、用量统计和按需路由。

2. 前提条件

已创建阿里云 AI 网关实例，并给网关所在VPC绑定公网NAT网关
已在阿里云百炼控制台开通目标模型（如通义千问、DeepSeek 等）并获取百炼的 API Key
安装Claude code客户端

3. 操作步骤

3.1. 创建 AI 服务

登录 AI 网关控制台
左侧导航栏选择服务 → 创建服务 ，来源选择 AI 服务
大模型供应商选择千问云/阿里云百炼，填写百炼 API Key，完成创建
如需接入多个供应商（如 DeepSeek），重复以上步骤再创建一个服务

建议 API Key 通过 KMS 凭据引用方式存储，避免明文泄露

3.2. 创建 Model API（Anthropic 兼容协议）

左侧导航栏选择 Model API → 创建 Model API → 选择文本生成
关键配置：

- 协议：必须选择 Anthropic 兼容（，Claude Code 使用 Anthropic 格式请求）
- BasePath ：/

域名最好选择自定义域名，如果没有，可以选择网关提供的域名供测试使用
完成创建后发布

注意：协议必须选 Anthropic 兼容，若选 OpenAI 兼容会导致 405 错误

服务类型 选择多服务（按模型名称）
添加路由规则（使用 Glob 语法匹配模型名）：

|-------------|-----------------------|
| Glob 匹配规则 | 路由到的服务 |
| qwen* | qwen（通义千问服务） |
| deepseek* | deepseek（DeepSeek 服务） |

（选）Fallback 根据需求配置
保存并发布

3.3. 配置消费者认证（可选，建议配置）

可给不同使用者分配一个消费者APIKEY，使用者用APIKEY调用后端大模型提供服务，观测方面也可基于消费者纬度进行统计。配置方式如下：

创建消费者，进入AI网关控制台，消费者 -创建消费者 -自定义消费者名称，认证方式选择APIKEY，系统自动生成凭证，凭证来源为 Authorization: Bearer <token>。

配置消费者认证鉴权，进入网关实例，点击左侧Model API→进入上面创建的modeapi → 消费者认证 → 编辑 → 启用认证
点击授权 → 将创建的2个消费者添加进来

3.4. 控制台调试

进入Medel API，点击右上角调试，发送请求看是否能调用成功，返回200即为成功。

4. 配置 Claude Code

Claude Code 的全局配置文件位于 ~/.claude/settings.json，其中 env 字段下的环境变量会在启动时自动注入，优先级高于终端中手动 export的同名环境变量。

编辑配置文件：

复制代码

# 用编辑器打开（macOS）
open ~/.claude/settings.json

# 或直接用 vi
vi ~/.claude/settings.json

配置文件中环境变量包含以下内容：

复制代码

{
  "env": {
    "ANTHROPIC_BASE_URL": "http://env-xxxxxx-cn-hangzhou.alicloudapi.com（网关的公网访问域名，如果网关绑定了自定义域名，使用自定义域名，测试域名每天1000次访问限制）",
    "ANTHROPIC_AUTH_TOKEN": "你的消费者凭证APIKEY（未开启认证填任意非空字符串）",
    "ANTHROPIC_MODEL": "qwen3.7-max",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "qwen3.6-flash",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "qwen3.7-max",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "qwen3.7-max",
    "CLAUDE_CODE_SUBAGENT_MODEL": "qwen3.7-max"
  }
}

4.1. 参数说明

|----------------------------------|---------------------------------------------------------------------------------------------------------|
| 参数 | 说明 |
| ANTHROPIC_BASE_URL | AI 网关的访问入口地址，从 Model API 列表页实例访问入口 复制，也可以使用自定义域名，格式：http://env-xxxxxx-cn-hangzhou.alicloudapi.com |
| ANTHROPIC_AUTH_TOKEN | 网关消费者认证凭证。开启认证时填写网关生成的凭证（即API KEY）；未开启认证时填任意非空字符串（如 test） |
| ANTHROPIC_MODEL | 默认使用的模型，直接执行 claude 命令时生效 |
| ANTHROPIC_DEFAULT_HAIKU_MODEL | Claude Haiku 角色对应的模型，用于轻量级背景任务（如代码补全、简短问答） |
| ANTHROPIC_DEFAULT_SONNET_MODEL | Claude Sonnet 角色对应的模型，用于常规编程任务（主力模型） |
| ANTHROPIC_DEFAULT_OPUS_MODEL | Claude Opus 角色对应的模型，用于复杂推理任务 |
| CLAUDE_CODE_SUBAGENT_MODEL | Claude Code 内部子 Agent 执行任务时使用的模型 |

排查问题时，务必先检查此文件，因为它会覆盖终端中手动 export 的同名环境变量

4.2. 启动与模型切换

复制代码

# 使用默认模型（settings.json 中配置的 ANTHROPIC_MODEL）
claude

# 切换到指定模型
claude --model qwen3.6-plus
claude --model deepseek-v4-pro

# 启动后在 Claude Code 内部切换
/model deepseek-v4-pro

使用qwen3.6-plus模型：

切换成deepseek-v4-pro：

4.3. 添加新模型

以后续添加新模型为例：

确认模型名称 ：如果添加百炼提供的模型，建议去百炼模型广场找到模型的模型 Code
添加路由规则 ：AI 网关 → 找到对应Model API → 编辑路由 → 新增 Glob 规则，如 gemini* → gemini 服务
使用：claude --model 模型Code

4.4. 验证与排查

验证网关是否可达：

复制代码

curl -X POST http://env-xxxxxx-cn-hangzhou.alicloudapi.com/v1/messages \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer 你的Token" \
  -d '{"model":"qwen3.7-max","max_tokens":10,"messages":[{"role":"user","content":"hi"}]}'

常见问题：

|-----------------------|---------------------------------------------------|---------------------------------|
| 错误 | 原因 | 解决方案 |
| 403 invalid api-key | Model API 协议选了 OpenAI 兼容 | 重新创建，协议选 Anthropic 兼容 |
| 403 invalid api-key | settings.json 中有旧的 ANTHROPIC_BASE_URL 覆盖了环境变量 | 检查并修改 ~/.claude/settings.json |
| 405 Not Allowed | ANTHROPIC_BASE_URL 缺少路径或路径不对 | 确认完整访问入口地址 |
| model not found | 模型名称与百炼平台不一致 | 去百炼控制台确认模型 Code |

5. 用量观测

所有请求经过 AI 网关后，可在控制台多维度查看用量数据。

5.1. 查看整体用量

登录 AI 网关控制台
进入目标 Model API
点击统计标签页

可基于模型、消费者 纬度筛选查询某段时间 内的token输入输出量 以及总量。

5.2. 按服务区分用量

由于路由配置了按模型名称分发，不同模型的请求会路由到不同的后端服务，可以在各个 AI 服务维度分别查看：

进入 AI 网关控制台 → 服务
分别点击 qwen（通义千问）和 deepseek（DeepSeek）服务
点击监控页签，查看各服务的统计数据，即可区分不同模型的用量，也支持查看不同消费者使用此服务的token情况

5.3. 查看请求日志

如需查看每一条请求的详细信息（模型名、耗时、Token 数等）：

进入 Model API → 日志标签页
可筛选时间范围，查看每条请求的模型名称、响应状态、Token 消耗等详情

开启 AI 请求日志后日志功能才可用，在 Model API 详情页 → API 详情 → 找到「AI 请求日志」开关确认已开启

6. 日志聚合查询（按消费者 + 模型统计 Token）

将日志投递到**阿里云日志服务（SLS）**后，可通过 SQL 对日志进行聚合分析，实现按消费者、按模型的 Token 用量统计并导出。

6.1. 查询单个消费者的模型用量

在 SLS 日志查询框中输入以下语句（将 claude1 替换为实际消费者名称）：

复制代码

"ai_log.consumer":claude1 | SELECT 
  "ai_log.model"             AS model,
  SUM("ai_log.input_token")  AS input_tokens,
  SUM("ai_log.output_token") AS output_tokens,
  COUNT(*)                   AS request_count
FROM log
GROUP BY model
ORDER BY input_tokens DESC

返回结果示例：

|-----------------|--------------|---------------|---------------|
| model | input_tokens | output_tokens | request_count |
| qwen3.6-plus | 987 | 828 | 11 |
| deepseek-v4-pro | 39684 | 643 | 9 |

6.2. 查询所有消费者的汇总用量

按消费者 + 模型两个维度分组，一次看全局用量分布：

复制代码

* | SELECT 
  "ai_log.consumer"          AS consumer,
  "ai_log.model"             AS model,
  SUM("ai_log.input_token")  AS input_tokens,
  SUM("ai_log.output_token") AS output_tokens,
  COUNT(*)                   AS request_count
FROM log
WHERE "ai_log.model" IS NOT NULL
GROUP BY consumer, model
ORDER BY consumer, input_tokens DESC

6.3. 导出数据

查询结果出来后，点击 下载日志 按钮，可导出为 CSV 文件，适合进一步用 Excel 分析或汇总费用报表。

6.4. 结合 STAROps

可以通过控制台提供的STAROps入口，通过自然语言查询。