用RNN训练语言模型时如何计算损失?
重要性:★
以"you say goodbye and i say hello."为例,将其作为具体的数据传入网络,此时 RNNLM 进行的处理如图所示:
RNNLM 可以"记忆"目前为止输入的单词,并以此为基础预测接下来会出现的单词。RNN 层通过从过去到现在继承并传递数据,使得编码和存储过去的信息成为可能。
在 Softmax 中通过损失误差 Cross Entropy Error 层来评估预测结果和实际标签之间的损失,RNNLM的损失是对所有时刻的误差的平均 ,如图所示: