循环神经网络

一、定义

1、潜变量自回归模型,使用潜变量ht总结过去信息

2、循环神经网络

(1)红框这一项如果去掉就跟MLP差不多,外层fai可以看做非线性函数(such:relu)

(2)当前的输出是为了预测当前的观察,没有对x建模,因为x的信息都存在h里面

(3)W_hh将对应的隐藏信息转化为真实信息, W_hh是将时序信息存放

3、困惑度

4、梯度剪裁

5、应用:文本生成、文本分类、问答、机器翻译、Tag生成

二、总结

1、对隐状态使用循环计算的神经网络称为循环神经网络(RNN)。

2、循环神经网络的隐状态可以捕获直到当前时间步序列的历史信息。

3、循环神经网络模型的参数数量不会随着时间步的增加而增加。

4、我们可以使用循环神经网络创建字符级语言模型。

相关推荐
静静AI学堂3 分钟前
Yolo11改策略:卷积改进|SAC,提升模型对小目标和遮挡目标的检测性能|即插即用
人工智能·深度学习·目标跟踪
martian66526 分钟前
【人工智能离散数学基础】——深入详解数理逻辑:理解基础逻辑概念,支持推理和决策系统
人工智能·数理逻辑·推理·决策系统
Schwertlilien27 分钟前
图像处理-Ch7-图像金字塔和其他变换
图像处理·人工智能
凡人的AI工具箱33 分钟前
每天40分玩转Django:Django类视图
数据库·人工智能·后端·python·django·sqlite
千天夜39 分钟前
深度学习中的残差网络、加权残差连接(WRC)与跨阶段部分连接(CSP)详解
网络·人工智能·深度学习·神经网络·yolo·机器学习
一勺汤40 分钟前
YOLOv8模型改进 第二十五讲 添加基于卷积调制(Convolution based Attention) 替换自注意力机制
深度学习·yolo·计算机视觉·模块·yolov8·yolov8改进·魔改
凡人的AI工具箱43 分钟前
每天40分玩转Django:实操图片分享社区
数据库·人工智能·后端·python·django
小军军军军军军1 小时前
MLU运行Stable Diffusion WebUI Forge【flux】
人工智能·python·语言模型·stable diffusion
诚威_lol_中大努力中1 小时前
关于VQ-GAN利用滑动窗口生成 高清图像
人工智能·神经网络·生成对抗网络
中关村科金1 小时前
中关村科金智能客服机器人如何解决客户个性化需求与标准化服务之间的矛盾?
人工智能·机器人·在线客服·智能客服机器人·中关村科金