IndexTTS2 实现零样本语音克隆:精准控制+情感解耦

IndexTTS2[1] 是一个突破性的自回归语音合成模型,能在零样本条件下实现两大核心能力:精确的时长控制,以及音色与情感的完美解耦。该模型支持包括愤怒、哭泣、恐惧、沮丧、快乐、惊讶、平静等在内的丰富情感表达。
不过目前官方只放出了演示网站和一些对比音频,期待后续能放出完整模型和代码。
NSFW Grok 推出数字伙伴

马斯克发文表示 Grok 1.1.17 版本带来了 Companions(数字伙伴)功能。更新后,用户只需在设置中向下滚动至语音部分,点击「启用伙伴」即可开启,需要 SuperGrok 订阅。
好感度系统,我只能说,老马是懂用户的。