Hermes 语音输入(STT)安装指南

完整的语音转写安装指南,可以直接给新的hermes agent使用。

Hermes 语音输入(STT)安装指南

前置条件

  • Hermes Agent 已安装

  • 有麦克风

步骤

  1. 安装 faster-whisper(语音识别引擎)

用 uv 装,不要用 pip(Hermes 的 pip 有版本错乱问题):

代码· bash uv pip install "faster-whisper>=1.0"

  1. 设置国内镜像(如果翻墙了就跳过)

代码· bash set HF_ENDPOINT=https://hf-mirror.com

  1. 下载 whisper 模型(首次需要下载)

代码· bash # 直接运行下面命令,会自动从 HuggingFace 下载 small 模型 python -c " from faster_whisper import WhisperModel model = WhisperModel('small', device='cpu') print('✅ 下载并加载成功') "

如果下载慢或失败:

  1. 配置 Hermes

代码· bash # 启用 STT hermes config set stt.enabled true hermes config set stt.provider local hermes config set stt.local.model small hermes config set stt.local.language zh # 设置录音快捷键(默认 Ctrl+B,改成不冲突的) hermes config set voice.record_key "ctrl+q"

  1. 重启 Hermes

新开一个会话生效。

  1. 使用

在 Hermes 输入框中:

代码 按 Ctrl+Q → 听到提示音 → 说话 → 按 Enter → 文字自动填入

全程离线、免费、不翻墙。

如果遇到问题

Q: 按快捷键没反应? → 快捷键被输入法/其他软件拦截了,换一个:

代码· bash hermes config set voice.record_key "ctrl+m"

Q: ModuleNotFoundError: No module named 'faster_whisper' → Hermes 的 pip 和 python 版本可能错位。用 uv pip install faster-whisper,不要用 pip install。

Q: ConnectTimeout / 下载超时 → 国内网络被墙了。有翻墙就开翻墙重试。没翻墙就:

代码· bash set HF_ENDPOINT=https://hf-mirror.com

然后再跑第 3 步。