Minimax WebSocket TTS 文档里 bitrate / sample_rate 的真实取值

结论:MiniMax 不支持 bitrate=24000,但支持 sample_rate=24000

你这里的"24K"要分清两个概念:

参数 含义 MiniMax 是否支持 24K
bitrate=24000 24 kbps 码率 不支持
sample_rate=24000 24 kHz 采样率 支持

MiniMax 官方参数里,sample_rate 支持 [8000, 16000, 22050, 24000, 32000, 44100],但 bitrate 只支持 [32000, 64000, 128000, 256000],并且 bitrate 只对 mp3 生效。WebSocket 示例里也是 sample_rate: 32000bitrate: 128000format: mp3。(MiniMax API Docs)

xiaozhi-esp32-server 里说的 24K,本质上是 24 kHz 采样率的 Opus 音频,不是 MiniMax 输出 24 kbps。项目默认协议配置是:

复制代码
xiaozhi:
  audio_params:
    format: opus
    sample_rate: 24000
    channels: 1
    frame_duration: 60

也就是设备端收的是 Opus / 24kHz / 单声道 / 60ms帧 。(GitHub)

具体到 MiniMax TTS 实现,项目里的 minimax_httpstream.py 默认设置是:

复制代码
"sample_rate": 24000,
"bitrate": 128000,
"format": "pcm",
"channel": 1

注意这里是 format: pcm,不是 mp3,所以 bitrate 实际不是关键参数;关键是 sample_rate=24000。项目还会在打开音频通道时把 MiniMax 的 sample_rate 更新为连接里的 conn.sample_rate。(GitHub)

它的实际链路是:

复制代码
文本
  ↓
MiniMax TTS
  ↓
输出 24kHz PCM
  ↓
xiaozhi-esp32-server 收到 PCM hex
  ↓
服务器端重新编码为 Opus
  ↓
发送给 ESP32

代码里可以看到,它从 MiniMax 返回数据里取 audio_hex,转成 PCM bytes,然后调用 opus_encoder.encode_pcm_to_opus_stream() 编成 Opus 发给设备。父类也会按 conn.sample_rate 创建 Opus 编码器。(GitHub)

所以你要这样理解:

复制代码
MiniMax 不支持 24kbps MP3
但 MiniMax 支持 24kHz PCM
xiaozhi 项目再把 24kHz PCM 转成 24kHz Opus

建议 MiniMax 配置保持这样:

复制代码
"audio_setting": {
  "sample_rate": 24000,
  "bitrate": 128000,
  "format": "pcm",
  "channel": 1
}

不要写:

复制代码
"bitrate": 24000

如果你最终想控制的是网络传输码率 24kbps 左右 ,应该改的是 Opus 编码器码率参数 ,不是 MiniMax 的 bitrate。MiniMax 这边只负责输出 24kHz PCM,后面压缩率由服务器 Opus 编码决定。

相关推荐
武子康5 分钟前
调查研究-213 UBTech U1:当人形机器人从“听懂指令“走向“情绪陪伴“
人工智能·机器人·agent
xyz_CDragon6 分钟前
OpenAI发布首款自研芯片Jalapeño:9个月流片,AI设计芯片的时代来了
人工智能·单片机·深度学习·神经网络·芯片设计
gooxi_hui12 分钟前
海量存力,智驭未来丨国鑫4U60盘位高密度存储服务器SL401-G4重磅上市
运维·服务器·人工智能
太子釢14 分钟前
Claude Code 工具调用机制详解
人工智能
ksueh20 分钟前
AI写小说接入文心一言教程:千帆API+向量记忆系统实现百万字长篇智能创作
人工智能·ai助手
不焦躁的程序员24 分钟前
程序员该补获客能力了
人工智能·程序员
AI科技星25 分钟前
基于32维Cayley_Dickson超复数的全域拓扑统一场论——反重力、真空自持供能、维度瞬移与星际宇宙脑秩序体系
人工智能·学习·算法·机器学习·数据挖掘
星马梦缘29 分钟前
机器学习与模式识别 第十四章 神经网络中的反向传播 模拟卷及答案
人工智能·神经网络·机器学习·微分·反向传播
吴bug32 分钟前
认识 Open-ACE — AI 编程智能体的工作空间
人工智能·ai·ai编程
ksueh36 分钟前
AI写小说工具哪个好用?9款AI工具使用体验(2026年横评)
人工智能·ai写作