Day32_【 NLP _2.RNN及其变体 _(3) GRU】

门控循环单元(GRU, Gated Recurrent Unit),它是循环神经网络(RNN)的一种重要变体,旨在解决传统RNN的长期依赖问题

优点缺点与前一小节LSTM一样,但结构更简单

一、结构

分为重置门和更新门

1.重置门

作用在上一个隐藏状态

2.更新门

重置后的上一个隐藏状态与当前值的输入更新门门值-->线性变换tanh激活-->未更新h

--> +((1-更新门门值)*上一个隐藏状态)-->更新后的h

集合重置门的输入,对当前输入进行内部计算,对结果进行输出

二、API

复制代码
nn.GRU(input_size, hidden_size, num_layers)   
input = (seq_len, batch_size, input_size) 
h0 = (num_layers, batch_size, hidden_size)
相关推荐
放下华子我只抽RuiKe514 分钟前
React 从入门到生产(四):自定义 Hook
前端·javascript·人工智能·深度学习·react.js·自然语言处理·前端框架
风落无尘3 小时前
第九章《语言与理解》 完整学习资料
gpt·rnn·语言模型·transformer
初心未改HD5 小时前
深度学习之LSTM与GRU门控循环单元详解
深度学习·gru·lstm
Yingjun Mo7 小时前
(二) LLM探索能力-1. 大语言模型能够进行上下文探索吗?
人工智能·语言模型·自然语言处理
财经资讯数据_灵砚智能7 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年5月20日
人工智能·python·信息可视化·自然语言处理·ai编程·灵砚智能
tzc_fly8 小时前
LLaDA2.0-Uni:基于扩散语言模型的统一多模态理解和生成
人工智能·语言模型·自然语言处理
Loo国昌8 小时前
从 Agent 编排到 Skill Runtime:企业 AI 工程化的下一层抽象
大数据·人工智能·后端·python·自然语言处理
AI技术控9 小时前
LangChain 是什么?从零开始学会 LangChain 的工程实践指南
人工智能·语言模型·自然语言处理·langchain·nlp
kcuwu.10 小时前
NLP入门技术博客
人工智能·自然语言处理
05大叔11 小时前
预训练模型演化,提示词工程
人工智能·深度学习·自然语言处理