神经网络与深度学习——第15章 序列生成模型

本文讨论的内容参考自《神经网络与深度学习》https://nndl.github.io/ 第15章 序列生成模型,习题还没做先存在这里。

序列生成模型


序列概率模型

序列生成


N元统计模型





深度序列模型

模型结构

嵌入层


特征层


输出层

参数学习

评价方法

困惑度


BLEU算法


ROUGE算法

序列生成模型中的学习问题

曝光偏差模型


训练目标不一致问题

计算效率问题


层次化Softmax




重要性采样





噪声对比估计




序列到序列模型


基于循环神经网络的序列到序列模型


基于注意力的序列到序列模型

基于自注意力的序列到序列模型

自注意力
多头自注意力
基于自注意力模型的序列编码


Transformer模型


总结和深入阅读


习题

相关推荐
Shawn_Shawn2 小时前
大模型的奥秘:Token与Transformer简单理解
人工智能·llm
weixin_377634843 小时前
【K-S 检验】Kolmogorov–Smirnov计算过程与示例
人工智能·深度学习·机器学习
菜鸟起航ing4 小时前
Spring AI 全方位指南:从基础入门到高级实战
java·人工智能·spring
Guheyunyi4 小时前
智慧消防管理系统如何重塑安全未来
大数据·运维·服务器·人工智能·安全
ZZY_dl4 小时前
训练数据集(三):真实场景下采集的课堂行为目标检测数据集,可直接用于YOLO各版本训练
人工智能·yolo·目标检测
yiersansiwu123d5 小时前
AI伦理治理:在创新与规范之间寻找动态平衡
人工智能
华清远见成都中心5 小时前
成都理工大学&华清远见成都中心实训,助力电商人才培养
大数据·人工智能·嵌入式
爱好读书5 小时前
AI生成er图/SQL生成er图在线工具
人工智能
CNRio5 小时前
智能影像:AI视频生成技术的战略布局与产业变革
人工智能
六行神算API-天璇5 小时前
架构思考:大模型作为医疗科研的“智能中间件”
人工智能·中间件·架构·数据挖掘·ar