Day32_【 NLP _2.RNN及其变体 _(3) GRU】

门控循环单元(GRU, Gated Recurrent Unit),它是循环神经网络(RNN)的一种重要变体,旨在解决传统RNN的长期依赖问题

优点缺点与前一小节LSTM一样,但结构更简单

一、结构

分为重置门和更新门

1.重置门

作用在上一个隐藏状态

2.更新门

重置后的上一个隐藏状态与当前值的输入更新门门值-->线性变换tanh激活-->未更新h

--> +((1-更新门门值)*上一个隐藏状态)-->更新后的h

集合重置门的输入,对当前输入进行内部计算,对结果进行输出

二、API

复制代码
nn.GRU(input_size, hidden_size, num_layers)   
input = (seq_len, batch_size, input_size) 
h0 = (num_layers, batch_size, hidden_size)
相关推荐
木头左1 小时前
高频交易中的LSTM模型实时数据流输入的设计与实现
人工智能·rnn·lstm
我不是小upper4 小时前
ARIMA-LSTM-Prophet 融合模型在股票预测中的应用
人工智能·rnn·lstm
TG:@yunlaoda360 云老大5 小时前
华为云国际站代理商的UCS主要有什么作用呢?
人工智能·自然语言处理·华为云·云计算
natide5 小时前
词汇/表达差异-1-编辑距离-莱文斯坦距离-Levenshtein
人工智能·深度学习·自然语言处理·知识图谱
会飞的小新5 小时前
大语言模型训练全流程(技术深度拆解版)---以DeepSeek为例
人工智能·语言模型·自然语言处理
jrlong5 小时前
三、Agent原理与最简实践学习笔记
人工智能·自然语言处理
gorgeous(๑>؂<๑)5 小时前
【清华大学-MM25】Open3D VQA:面向无人机开放空间的多模态大语言模型空间推理基准
人工智能·语言模型·自然语言处理·无人机
2401_841495645 小时前
【自然语言处理】共生与引领:自然语言处理与人工智能的深度绑定与协同演进
人工智能·深度学习·自然语言处理·多模态·通用智能·规则驱动·认知智能
蓝海星梦6 小时前
Chain‑of‑Thought 推理链评估全解析:从参考方法到无参考指标
论文阅读·人工智能·自然语言处理·cot
智算菩萨6 小时前
自然语言处理常用Python库:spaCy使用全解
人工智能·python·自然语言处理