随着技术的发展,拼接合成法逐渐兴起。这种方法首先录制大量语音片段,尽可能覆盖各种音素组合。合成语音时,从语料库中为每个音素选择最合适的录音片段,然后将它们拼接成完整的句子。由于声音片段是事先录制的真实语音,生成的声音比参数合成更接近人声。图展示了从句子"拿黑衣帽"中提取音素片段并拼接成新句子"你好"的过程。

拼接合成法示意图
拼接合成法生成的语音质量较高,但这种方法需要存储大量语料,占用存储空间较大。同时,由于语料是固定的,发音的灵活性受限,例如无法合成各种音色的声音。
随着技术的发展,拼接合成法逐渐兴起。这种方法首先录制大量语音片段,尽可能覆盖各种音素组合。合成语音时,从语料库中为每个音素选择最合适的录音片段,然后将它们拼接成完整的句子。由于声音片段是事先录制的真实语音,生成的声音比参数合成更接近人声。图展示了从句子"拿黑衣帽"中提取音素片段并拼接成新句子"你好"的过程。

拼接合成法示意图
拼接合成法生成的语音质量较高,但这种方法需要存储大量语料,占用存储空间较大。同时,由于语料是固定的,发音的灵活性受限,例如无法合成各种音色的声音。