李沐54_循环神经网络RNN——自学笔记

潜变量自回归模型

使用潜变量ht总结过去信息。

困惑度perplexity

1.衡量一个语言模型的好坏可以用平均交叉熵

2.历史原因NLP使用困惑度exp(Π)来衡量,是平均每次可能选项

3.无穷大是最差,1是完美

梯度裁剪

1.迭代中计算这T个时间步的梯度,在反向传播过程中产生长度为O(T)的矩阵乘法链,导致数值不稳定

2.梯度裁剪可以有效预防梯度爆炸。如果梯度长度超过θ,那么拖影回长度θ

总结

1.循环神经网络的输出取决于当下输入和前一时间的隐变量

2.应用到语言模型中时,循环神经网络根据当前词预测下一次时刻词

3.通常使用困惑度来衡量语言模型的好坏

python 复制代码
相关推荐
Wgrape8 分钟前
一文了解常见AI搜索方案的代码实现
人工智能·后端
m0_5284892513 分钟前
Pycharm修改系统缓存路径(包含config, system, plugins, logs, remote sources等)
ide·python·pycharm·c盘
中医正骨葛大夫17 分钟前
一文解决如何在Pycharm中创建cuda深度学习环境?
pytorch·深度学习·pycharm·软件安装·cuda·anaconda·配置环境
Vadaski19 分钟前
私有 Context 工程如何落地:从方法论到实战
人工智能·程序员
Franklin20 分钟前
AI Coding 基础实践03 - Trae AI在Pycharm中的使用02 - 读取不了项目的文件问题解决
ide·python·pycharm
胖墩会武术20 分钟前
【OpenCV图像处理】深度学习:cv2.dnn() —— 图像分类、人脸检测、目标检测
图像处理·pytorch·python·opencv
帮帮志22 分钟前
PyCharm 开发工具 不同的模式
ide·python·pycharm
刘国华-平价IT运维课堂26 分钟前
红帽企业Linux 10.1发布:AI命令行助手、量子安全加密和混合云创新
linux·运维·服务器·人工智能·云计算
Xiaok101827 分钟前
在 Jupyter Notebook 中启动 TensorBoard
人工智能·python·jupyter
亚马逊云开发者42 分钟前
相得益彰:Mem0 记忆框架与亚马逊云科技的企业级 AI 实践
人工智能