李沐54_循环神经网络RNN——自学笔记

潜变量自回归模型

使用潜变量ht总结过去信息。

困惑度perplexity

1.衡量一个语言模型的好坏可以用平均交叉熵

2.历史原因NLP使用困惑度exp(Π)来衡量,是平均每次可能选项

3.无穷大是最差,1是完美

梯度裁剪

1.迭代中计算这T个时间步的梯度,在反向传播过程中产生长度为O(T)的矩阵乘法链,导致数值不稳定

2.梯度裁剪可以有效预防梯度爆炸。如果梯度长度超过θ,那么拖影回长度θ

总结

1.循环神经网络的输出取决于当下输入和前一时间的隐变量

2.应用到语言模型中时,循环神经网络根据当前词预测下一次时刻词

3.通常使用困惑度来衡量语言模型的好坏

python 复制代码
相关推荐
zhangshuang-peta14 小时前
MCP 的执行与回执:如何让每一步可追踪、可验证、可审计?
人工智能·ai agent·mcp·peta
无代码专家14 小时前
轻流 AI OA 系统的持续演进之路——生产管理全流程解析
人工智能·无代码
高频交易dragon14 小时前
claude实现缠论(买卖点)
大数据·python
码农垦荒笔记14 小时前
LLM 后训练革命:GRPO、DAPO 与 RLVR 如何替代 RLHF 重塑大模型对齐训练
人工智能·强化学习·grpo·dapo
Hello.Reader14 小时前
Spark 4.0 新特性Python Data Source API 快速上手
python·ajax·spark
xixixi7777714 小时前
AI 用于漏洞检测、威胁狩猎、合规审查;安全沙箱 / 隐私计算保障 AI 模型与数据可信
人工智能·网络安全·ai·openai·数据·多模型
水如烟14 小时前
孤能子视角:数字时代,“社会生产关系“[4],具身虚拟身份,耦合强度追责
人工智能
superior tigre14 小时前
鱼书深度学习系列(导航目录)
人工智能·深度学习
云境筑桃源哇14 小时前
Token 中文定名词元,国产 AI 工具如何抢占词元红利?
人工智能