神经网络与深度学习——第15章 序列生成模型

本文讨论的内容参考自《神经网络与深度学习》https://nndl.github.io/ 第15章 序列生成模型,习题还没做先存在这里。

序列生成模型


序列概率模型

序列生成


N元统计模型





深度序列模型

模型结构

嵌入层


特征层


输出层

参数学习

评价方法

困惑度


BLEU算法


ROUGE算法

序列生成模型中的学习问题

曝光偏差模型


训练目标不一致问题

计算效率问题


层次化Softmax




重要性采样





噪声对比估计




序列到序列模型


基于循环神经网络的序列到序列模型


基于注意力的序列到序列模型

基于自注意力的序列到序列模型

自注意力
多头自注意力
基于自注意力模型的序列编码


Transformer模型


总结和深入阅读


习题

相关推荐
npupengsir12 分钟前
nano vllm代码详解
人工智能·算法·vllm
CyanMind19 分钟前
IsaacLab 训练范式探索(一):让机器人拥有“记忆”的 RNN 策略
人工智能·rnn·机器人
翼龙云_cloud28 分钟前
阿里云渠道商:百炼模型选型指南 性能与成本全解析
人工智能·阿里云·云计算
chushiyunen31 分钟前
人工智能-语义校验deepEval笔记
人工智能·笔记
齐齐大魔王32 分钟前
智能语音处理(一)
人工智能·语音识别
Spliceㅤ36 分钟前
项目:基于qwen的点餐系统
开发语言·人工智能·python·机器学习·自然语言处理
李子琪。1 小时前
数字技术认证体系备考实践与职业效能研究
人工智能·经验分享
cd_949217211 小时前
告别硬床误区,梦百合以AI科技重塑正确睡眠观
大数据·人工智能·科技
janeysj1 小时前
安装windows本地OpenClaw并连接飞书
人工智能·飞书
RSFeegg1 小时前
【AI Agent 学习笔记task2】Day3 Hello-Agents 第二章:智能体发展史深度解读
人工智能·笔记·学习