人工智能应用-机器听觉:7. 统计合成法

2000 年以后,研究者提出了基于统计模型的语音合成方法。与拼接法保留原始录音片段不同,统计合成法将语料库中每个音素的语音片段"总结"成一个称为隐马尔可夫模型(HMM)的统计模型。在前一节中讨论过,HMM 模型可以描述发音的动态过程,因此可以用来合成声音。具体而言,首先用 HMM 模型生成每个音素的声门和声道的参数,再利用声码器(源-滤波模型)从这些参数合成语音。如图 30.9所示,对每个音素("n""i""h""ao")分别建立 HMM 模型,利用这些模型生成声门和声道参数,再通过声码器读取这些参数并合成语音。
统计模型的一个优势在于其可扩展性。通过调整模型参数,合成系统可以改变发音的特性。例如,只需少量训练数据就可以让模型模拟不同人的声音,或调整语音的情感表现。

然而,HMM 学习的是声音的平均特性,无法模拟真实语音中丰富的动态特性。因此,基于HMM 生成的语音通常较为平滑,缺乏真实语音的动态感。

统计合成法示意图

相关推荐
Elastic 中国社区官方博客19 小时前
使用 Azure SRE Agent 和 Elasticsearch 提升 SRE 生产力
大数据·人工智能·elasticsearch·microsoft·搜索引擎·云原生·azure
發糞塗牆19 小时前
【Azure 架构师学习笔记 】- Azure AI(19) - Agent升级增强
人工智能·ai·azure
luoganttcc1 天前
自动驾驶 世界模型 有哪些(二)
人工智能·机器学习·自动驾驶
人工智能AI技术1 天前
315曝光AI投毒!用C#构建GEO污染检测与数据安全防护方案
人工智能·c#
Hamm1 天前
不想花一分钱玩 OpenClaw?来,一起折腾这个!
javascript·人工智能·agent
_李小白1 天前
【AI大模型学习笔记之平台篇】第二篇:Gemini
人工智能·音视频
一点一木1 天前
🚀 2026 年 2 月 GitHub 十大热门项目排行榜 🔥
人工智能·github
理性的曜1 天前
VoloData——基于LangChain的智能数据分析系统
人工智能·vscode·数据分析·npm·reactjs·fastapi·ai应用
flying_13141 天前
图神经网络分享系列-MPNN(Neural Message Passing for Quantum Chemistry)(二)
人工智能·深度学习·神经网络·图神经网络·消息传递·门控机制·mpnn
HyperAI超神经1 天前
AI驱动量子精修,卡内基梅隆大学等提出AQuaRef,首次用量子力学约束精修蛋白质全原子模型
人工智能·深度学习·机器学习·架构·机器人·cpu·量子计算