李沐54_循环神经网络RNN——自学笔记

潜变量自回归模型

使用潜变量ht总结过去信息。

困惑度perplexity

1.衡量一个语言模型的好坏可以用平均交叉熵

2.历史原因NLP使用困惑度exp(Π)来衡量,是平均每次可能选项

3.无穷大是最差,1是完美

梯度裁剪

1.迭代中计算这T个时间步的梯度,在反向传播过程中产生长度为O(T)的矩阵乘法链,导致数值不稳定

2.梯度裁剪可以有效预防梯度爆炸。如果梯度长度超过θ,那么拖影回长度θ

总结

1.循环神经网络的输出取决于当下输入和前一时间的隐变量

2.应用到语言模型中时,循环神经网络根据当前词预测下一次时刻词

3.通常使用困惑度来衡量语言模型的好坏

python 复制代码
相关推荐
AI医影跨模态组学几秒前
NPJ Digit Med(IF=15.1)河北医科大学第四医院赵群等团队:多模态数字活检用于胃癌隐匿性腹膜转移的术前预测
人工智能·机器学习·医学·医学影像
IT_陈寒1 分钟前
React的useEffect把我坑惨了,这种闭包问题谁能想到
前端·人工智能·后端
zero15972 分钟前
Python 8天极速入门笔记(大模型工程师专用):第八篇-Python 综合实战|完整大模型调用脚本,8 天成果落地
人工智能·python·ai编程·大模型开发
小付爱coding2 分钟前
【AI核心原理30讲】-Transformer架构
人工智能·深度学习·transformer
若尘7972 分钟前
【 AI 工作流】
人工智能
码农小白AI3 分钟前
AI审核驱动动态预警:IACheck如何重塑环境数据一致性监测与质量管控新模式
大数据·人工智能
Warren2Lynch4 分钟前
为什么选择 Flipbook 与 OpenDocs?用户体验分享
人工智能·架构·ux
iNeuOS工业互联网4 分钟前
开源:iNeuOS_Doctor,一款基于人工智能在医疗领域的病情咨询及医学影像分析平台,例如CT\X光片\病理成像\诊断病历等
人工智能·开源·制造·智能制造·工业互联网·ineuos
孤魂2334 分钟前
机器学习基本概念
python·机器学习
LaughingZhu4 分钟前
Product Hunt 每日热榜 | 2026-04-02
大数据·人工智能·经验分享·搜索引擎