我给你整理直接可用、一步到位 的阿里云百炼模型接入 hermes setup model 配置方案,适配主流 Hermes 框架(大模型应用编排 / 代理框架)。
前置准备(必须先做)
- 登录 阿里云百炼控制台 :https://dashscope.console.aliyun.com/
- 获取 API-KEY(百炼统一调用密钥)
- 记住百炼模型编码 (常用):
qwen-plus通义千问增强版qwen-turbo通义千问极速版qwen-long长文本版qwen-72b-chat72B 模型- qwen3-235b-a22b
hermes配置
运行
选择对应的20
bash
hermes setup model

填写对应的URL
bash
https://dashscope.aliyuncs.com/compatible-mode/v1

选择对应的模型

配置多个 API Key
- 输入
y并回车; - 按照提示,依次输入新的 API Key 信息(和之前配置 Key 的流程一样);
- 重复这个过程,直到所有备用 Key 都添加完成。

配置同提供商 API Key 轮询策略
| 选项 | 名称 | 工作逻辑 | 适用场景 |
|---|---|---|---|
| 1 | Fill-first /sticky(默认) | 持续使用第一个健康的 API Key,直到它额度用尽或被限流,才切换到下一个 | 绝大多数场景,个人开发 / 小规模使用,优先保证单一 Key 的稳定性 |
| 2 | Round robin(轮询) | 每次请求后自动切换到下一个健康的 Key,按顺序循环使用 | 高并发场景,想把请求均匀分摊到多个 Key 上,降低单个 Key 被限流的概率 |
| 3 | Random(随机) | 每次请求随机选一个健康的 Key | 测试 / 压测场景,或者希望请求分布更随机,避免轮询的顺序性 |
操作建议
- 如果你是个人 / 普通开发使用 :直接按回车,使用默认的
1. Fill-first即可。- 它会优先用你配置的第一个 Key,只有在它失效时才切换备用 Key,简单稳定,不容易出问题。
- 如果你是高并发 / 生产环境 :输入
2再回车,选择Round robin。- 它能均匀分摊请求,避免单个 Key 快速被限流,提高整体可用性。
Random一般不推荐日常使用,除非你有特殊的压测 / 负载需求。

TTS(文本转语音)服务商选择界面
| 序号 | 服务商 | 特点 | 推荐场景 |
|---|---|---|---|
| 1 | Edge TTS | 免费、云端调用、无需额外配置 API Key | 个人开发 / 测试,不想折腾、零成本使用 |
| 2 | ElevenLabs | 音质顶尖、支持情感控制,需 API Key | 对语音质量有极高要求的场景(如播客、配音) |
| 3 | OpenAI TTS | 音质稳定,支持多语言,需 API Key | 已有 OpenAI Key,想快速接入 TTS 的场景 |
| 8 | NeuTTS | 本地离线运行,免费,但需下载约 300MB 模型 | 完全离线 / 隐私敏感场景,不想把文本传到云端 |
| 9 | Keep current (Edge TTS) | 保持当前已配置的 Edge TTS 设置 | 不想修改现有配置,直接沿用之前的选择 |
操作建议
- 如果你是第一次配置、想快速上手 :直接按回车,选择默认的
9. Keep current (Edge TTS),或者输入1回车,用免费的 Edge TTS,零配置就能用。 - 如果你想体验更好的音质 :输入
2(ElevenLabs)或3(OpenAI TTS),然后按提示输入对应的 API Key 即可。 - 如果你需要离线使用 :输入
8回车,工具会自动下载 NeuTTS 模型,后续无需联网就能用。

配置完成

启动服务
bash
hermes

