神经网络与深度学习——第15章 序列生成模型

本文讨论的内容参考自《神经网络与深度学习》https://nndl.github.io/ 第15章 序列生成模型,习题还没做先存在这里。

序列生成模型


序列概率模型

序列生成


N元统计模型





深度序列模型

模型结构

嵌入层


特征层


输出层

参数学习

评价方法

困惑度


BLEU算法


ROUGE算法

序列生成模型中的学习问题

曝光偏差模型


训练目标不一致问题

计算效率问题


层次化Softmax




重要性采样





噪声对比估计




序列到序列模型


基于循环神经网络的序列到序列模型


基于注意力的序列到序列模型

基于自注意力的序列到序列模型

自注意力
多头自注意力
基于自注意力模型的序列编码


Transformer模型


总结和深入阅读


习题

相关推荐
丁学文武6 分钟前
如何把ChatGPT嵌入到自己的应用中?
人工智能·chatgpt·编码·大模型应用·ai替代
深圳南柯电子20 分钟前
纯电汽车EMC整改:预防性设计节省47%预算|深圳南柯电子
网络·人工智能·汽车·互联网·实验室·emc
说私域22 分钟前
定制开发开源AI智能名片S2B2C商城系统:新零售革命下云零售模式的创新实践
人工智能·开源·零售
zzZ656524 分钟前
U-net 系列算法总结
人工智能·深度学习·机器学习
AI科技星27 分钟前
基于空间螺旋运动假设的水星近日点进动理论推导与验证
数据结构·人工智能·经验分享·算法·计算机视觉
程序员大雄学编程30 分钟前
用Python来学微积分22-费马定理
人工智能·python·数学·微积分
deephub41 分钟前
sklearn 特征选择实战:用 RFE 找到最优特征组合
人工智能·python·机器学习·sklearn·特征选择
大大dxy大大1 小时前
sklearn-提取字典特征
人工智能·算法·sklearn
AI_56781 小时前
外卖骑手的Python转型指南:从送餐到编程的实战路径
人工智能