李沐54_循环神经网络RNN——自学笔记

潜变量自回归模型

使用潜变量ht总结过去信息。

困惑度perplexity

1.衡量一个语言模型的好坏可以用平均交叉熵

2.历史原因NLP使用困惑度exp(Π)来衡量,是平均每次可能选项

3.无穷大是最差,1是完美

梯度裁剪

1.迭代中计算这T个时间步的梯度,在反向传播过程中产生长度为O(T)的矩阵乘法链,导致数值不稳定

2.梯度裁剪可以有效预防梯度爆炸。如果梯度长度超过θ,那么拖影回长度θ

总结

1.循环神经网络的输出取决于当下输入和前一时间的隐变量

2.应用到语言模型中时,循环神经网络根据当前词预测下一次时刻词

3.通常使用困惑度来衡量语言模型的好坏

python 复制代码
相关推荐
小王毕业啦13 小时前
2007-2024年 地级市-公共数据开放DID
大数据·人工智能·数据挖掘·数据分析·数据统计·社科数据·实证数据
飞Link13 小时前
【轻量拓展区】网络 QoS 与带宽、延迟、抖动:AI 推理的性能瓶颈
开发语言·网络·人工智能
白日做梦Q13 小时前
Transformer 能否取代 CNN?图像去噪中的新范式探索
深度学习·cnn·transformer
南极星100513 小时前
OPENCV(python)--初学之路(十四)哈里斯角检测
人工智能·opencv·计算机视觉
咚咚王者13 小时前
人工智能之数据分析 Pandas:第九章 性能优化
人工智能·数据分析·pandas
Acrel1500035313813 小时前
重构能源管理:Acrel EMS 3.0 让降本增效成为底层逻辑
大数据·人工智能
测试199813 小时前
软件测试之压力测试
自动化测试·软件测试·python·测试工具·职场和发展·测试用例·压力测试
Swizard13 小时前
极限瘦身:将 Python AI 应用从 100MB 砍到 30MB
java·python·ai·移动开发
编织幻境的妖13 小时前
Python代码性能优化工具与方法
开发语言·python·性能优化
dhdjjsjs13 小时前
Day31 PythonStudy
人工智能·机器学习