一、定义
1、潜变量自回归模型,使用潜变量ht总结过去信息
2、循环神经网络
(1)红框这一项如果去掉就跟MLP差不多,外层fai可以看做非线性函数(such:relu)
(2)当前的输出是为了预测当前的观察,没有对x建模,因为x的信息都存在h里面
(3)W_hh将对应的隐藏信息转化为真实信息, W_hh是将时序信息存放
3、困惑度
4、梯度剪裁
5、应用:文本生成、文本分类、问答、机器翻译、Tag生成
二、总结
1、对隐状态使用循环计算的神经网络称为循环神经网络(RNN)。
2、循环神经网络的隐状态可以捕获直到当前时间步序列的历史信息。
3、循环神经网络模型的参数数量不会随着时间步的增加而增加。
4、我们可以使用循环神经网络创建字符级语言模型。