循环神经网络

一、定义

1、潜变量自回归模型,使用潜变量ht总结过去信息

2、循环神经网络

(1)红框这一项如果去掉就跟MLP差不多,外层fai可以看做非线性函数(such:relu)

(2)当前的输出是为了预测当前的观察,没有对x建模,因为x的信息都存在h里面

(3)W_hh将对应的隐藏信息转化为真实信息, W_hh是将时序信息存放

3、困惑度

4、梯度剪裁

5、应用:文本生成、文本分类、问答、机器翻译、Tag生成

二、总结

1、对隐状态使用循环计算的神经网络称为循环神经网络(RNN)。

2、循环神经网络的隐状态可以捕获直到当前时间步序列的历史信息。

3、循环神经网络模型的参数数量不会随着时间步的增加而增加。

4、我们可以使用循环神经网络创建字符级语言模型。

相关推荐
陆通42 分钟前
10分钟Windows系统安装迷你版的OpenClaw ,小小龙虾Nanobot
人工智能
老张的码43 分钟前
飞书 × OpenClaw 接入指南
人工智能·后端
mCell1 小时前
分享一个常用的文生图提示词
人工智能·llm·数据可视化
踩着两条虫1 小时前
如何让AI精准修改你的Vue代码?揭秘增量更新器实现原理
人工智能·openai·ai编程
Narrastory1 小时前
明日香 - Pytorch 快速入门保姆级教程(三)
pytorch·深度学习
ZFSS1 小时前
SeeDance Tasks API 的对接和使用
前端·人工智能
睿智的仓鼠1 小时前
🦞OpenClaw 快速部署及使用指南
前端·人工智能
jerrywus1 小时前
为什么每个程序员都应该试试 cmux:AI 加持的终端效率革命
前端·人工智能·claude
孟祥_成都2 小时前
AI 术语满天飞?90% 的人只懂名词,不懂为什么!
前端·人工智能