人工智能应用-机器听觉:7. 统计合成法

2000 年以后,研究者提出了基于统计模型的语音合成方法。与拼接法保留原始录音片段不同,统计合成法将语料库中每个音素的语音片段"总结"成一个称为隐马尔可夫模型(HMM)的统计模型。在前一节中讨论过,HMM 模型可以描述发音的动态过程,因此可以用来合成声音。具体而言,首先用 HMM 模型生成每个音素的声门和声道的参数,再利用声码器(源-滤波模型)从这些参数合成语音。如图 30.9所示,对每个音素("n""i""h""ao")分别建立 HMM 模型,利用这些模型生成声门和声道参数,再通过声码器读取这些参数并合成语音。
统计模型的一个优势在于其可扩展性。通过调整模型参数,合成系统可以改变发音的特性。例如,只需少量训练数据就可以让模型模拟不同人的声音,或调整语音的情感表现。

然而,HMM 学习的是声音的平均特性,无法模拟真实语音中丰富的动态特性。因此,基于HMM 生成的语音通常较为平滑,缺乏真实语音的动态感。

统计合成法示意图

相关推荐
笨蛋不要掉眼泪2 小时前
Spring Boot集成LangChain4j:与大模型对话的极速入门
java·人工智能·后端·spring·langchain
昨夜见军贴06162 小时前
IACheck AI审核技术赋能消费认证:为智能宠物喂食器TELEC报告构筑智能合规防线
人工智能·宠物
DisonTangor2 小时前
阿里开源语音识别模型——Qwen3-ASR
人工智能·开源·语音识别
万事ONES2 小时前
ONES 签约北京高级别自动驾驶示范区专设国有运营平台——北京车网
人工智能·机器学习·自动驾驶
qyr67893 小时前
深度解析:3D细胞培养透明化试剂供应链与主要制造商分布
大数据·人工智能·3d·市场分析·市场报告·3d细胞培养·细胞培养
软件开发技术深度爱好者3 小时前
浅谈人工智能(AI)对个人发展的影响
人工智能
一路向北he3 小时前
esp32 arduino环境的搭建
人工智能
SmartBrain3 小时前
Qwen3-VL 模型架构及原理详解
人工智能·语言模型·架构·aigc
renhongxia13 小时前
AI算法实战:逻辑回归在风控场景中的应用
人工智能·深度学习·算法·机器学习·信息可视化·语言模型·逻辑回归