Day32_【 NLP _2.RNN及其变体 _(3) GRU】

门控循环单元(GRU, Gated Recurrent Unit),它是循环神经网络(RNN)的一种重要变体,旨在解决传统RNN的长期依赖问题

优点缺点与前一小节LSTM一样,但结构更简单

一、结构

分为重置门和更新门

1.重置门

作用在上一个隐藏状态

2.更新门

重置后的上一个隐藏状态与当前值的输入更新门门值-->线性变换tanh激活-->未更新h

--> +((1-更新门门值)*上一个隐藏状态)-->更新后的h

集合重置门的输入,对当前输入进行内部计算,对结果进行输出

二、API

复制代码
nn.GRU(input_size, hidden_size, num_layers)   
input = (seq_len, batch_size, input_size) 
h0 = (num_layers, batch_size, hidden_size)
相关推荐
一个帅气昵称啊1 小时前
基于.NET AgentFramework开发OpenClaw智能体框架
人工智能·自然语言处理·c#·.net·openclaw
柯儿的天空4 小时前
Mem0深度解析:给你的ai agent加上长期记忆,让ai从“健忘“到“过目不忘“
人工智能·gpt·自然语言处理·ai作画·aigc·ai编程·agi
懒麻蛇5 小时前
用大语言模型生成心理学范式 2.0
人工智能·语言模型·自然语言处理
AI产品备案6 小时前
生成式人工智能(大语言模型)上线备案表【模版分享+填报指南】
人工智能·语言模型·自然语言处理
龙腾AI白云6 小时前
如何利用大语言模型的能力进行实体关系抽取
人工智能·语言模型·自然语言处理·tornado
CyanMind9 小时前
IsaacLab 训练范式探索(一):让机器人拥有“记忆”的 RNN 策略
人工智能·rnn·机器人
Spliceㅤ9 小时前
项目:基于qwen的点餐系统
开发语言·人工智能·python·机器学习·自然语言处理
有为少年10 小时前
ArXiv 2603 | 用神经元胞自动机训练语言模型:合成数据能超越自然语言吗?
人工智能·语言模型·自然语言处理
韭菜盖饭10 小时前
大模型常见八股集合(带答案)
语言模型·自然语言处理·面试·transformer
AI精钢10 小时前
Agent Harness,正在成为新的 MLOps
人工智能·自然语言处理·语音识别·mlops·ai agent·agentops·ai engineering