人工智能应用-机器听觉:7. 统计合成法

2000 年以后,研究者提出了基于统计模型的语音合成方法。与拼接法保留原始录音片段不同,统计合成法将语料库中每个音素的语音片段"总结"成一个称为隐马尔可夫模型(HMM)的统计模型。在前一节中讨论过,HMM 模型可以描述发音的动态过程,因此可以用来合成声音。具体而言,首先用 HMM 模型生成每个音素的声门和声道的参数,再利用声码器(源-滤波模型)从这些参数合成语音。如图 30.9所示,对每个音素("n""i""h""ao")分别建立 HMM 模型,利用这些模型生成声门和声道参数,再通过声码器读取这些参数并合成语音。
统计模型的一个优势在于其可扩展性。通过调整模型参数,合成系统可以改变发音的特性。例如,只需少量训练数据就可以让模型模拟不同人的声音,或调整语音的情感表现。

然而,HMM 学习的是声音的平均特性,无法模拟真实语音中丰富的动态特性。因此,基于HMM 生成的语音通常较为平滑,缺乏真实语音的动态感。

统计合成法示意图

相关推荐
水木流年追梦几秒前
大模型入门-Pre-Training、SFT、RLHF
人工智能·深度学习·机器学习
云烟成雨TD几秒前
Spring AI Alibaba 1.x 系列【57】SAA Admin 前后端技术栈与分层设计详解
java·人工智能·spring
智慧景区与市集主理人2 分钟前
商户摊位规范经营!巨有科技助力优化景区商业管控体系
大数据·人工智能·科技
@蔓蔓喜欢你2 分钟前
前端状态管理方案:从简单到复杂的演进
人工智能·ai
九皇叔叔3 分钟前
Spring-Ai-Alibaba [02] chatclient-demo
java·人工智能·spring·ai
山西茄子3 分钟前
DeepStream9.0 inference_builder
人工智能·deepstream
@蔓蔓喜欢你4 分钟前
Docker 部署实战:前端应用容器化指南
人工智能·ai
鲸采云SRM采购管理系统5 分钟前
供应链高效管控:依托鲸采云 SRM AI+飞书 精准筛选优质供应商
人工智能·飞书
@蔓蔓喜欢你5 分钟前
前端架构演进:从单体到微前端
人工智能·ai
weixin_426150706 分钟前
AI辅助Oracle容量规划:告别拍脑袋扩容
运维·数据库·人工智能·oracle