gmm-hmm

【语音识别】声学建模中基于树的状态绑定单音素HMM模型不能很好的应对自然说话人发音时的渐变过程，比如从一个音素转换到另一个音素时会存在协同发音现象。因此语音识别的先驱者提出了上下文建模概念，即使用中心音素（单因素）和前后两个音素组成三音素对每一个发音进行建模。三因素和单因素一样都是使用三状态的HMM，只是将原来的单因素的模型扩充了。比如原先用40个单因素进行建模，使用三因素时，理论上需要40x40x40个音素，总共40x40x40x3个状态。这样盲目扩充造成了参数过多，训练数据不足的问题。因此需要将相似的三因素进行合并。一种高效的方法是构造二

我是有底线的