本文讨论的内容参考自《神经网络与深度学习》https://nndl.github.io/ 第15章 序列生成模型,习题还没做先存在这里。
序列生成模型
序列概率模型

序列生成
N元统计模型
深度序列模型

模型结构

嵌入层
特征层
输出层

参数学习

评价方法

困惑度
BLEU算法
ROUGE算法

序列生成模型中的学习问题

曝光偏差模型
训练目标不一致问题

计算效率问题
层次化Softmax
重要性采样
噪声对比估计

序列到序列模型
基于循环神经网络的序列到序列模型
基于注意力的序列到序列模型

基于自注意力的序列到序列模型

自注意力

多头自注意力

基于自注意力模型的序列编码
Transformer模型
总结和深入阅读
习题

