GRU门控循环单元

GRU

视频链接

bash 复制代码
https://www.bilibili.com/video/BV1Pk4y177Xg?p=23&spm_id_from=pageDriver&vd_source=3b42b36e44d271f58e90f86679d77db7

Zt---更新门

Rt---重置门

控制保存之前一层信息多,还是保留当前神经元得到的隐藏层的信息多。

Bi-GRU

GRU比LSTM参数少

GRU代码


GRU的优势和缺点

transformer直接把不可并行的问题解决了

相关推荐
新智元2 分钟前
刚刚,谷歌深夜上新 Veo 3.1!网友狂刷 2.75 亿条,Sora 2 要小心了
人工智能·openai
yuzhuanhei10 分钟前
Segment Anything(SAM)
人工智能
做科研的周师兄12 分钟前
【机器学习入门】7.4 随机森林:一文吃透随机森林——从原理到核心特点
人工智能·学习·算法·随机森林·机器学习·支持向量机·数据挖掘
lll上15 分钟前
三步对接gpt-5-pro!地表强AI模型实测
人工智能·gpt
喜欢吃豆20 分钟前
一份关于语言模型对齐的技术论述:从基于PPO的RLHF到直接偏好优化
人工智能·语言模型·自然语言处理·大模型·强化学习
超龄超能程序猿1 小时前
Spring AI Alibaba 与 Ollama对话历史的持久化
java·人工智能·spring
孤狼灬笑1 小时前
机器学习四范式(有监督、无监督、强化学习、半监督学习)
人工智能·强化学习·无监督学习·半监督学习·有监督学习
第七序章1 小时前
【C++】AVL树的平衡机制与实现详解(附思维导图)
c语言·c++·人工智能·机器学习
晨非辰1 小时前
【面试高频数据结构(四)】--《从单链到双链的进阶,读懂“双向奔赴”的算法之美与效率权衡》
java·数据结构·c++·人工智能·算法·机器学习·面试
阿里云大数据AI技术1 小时前
云栖实录 | 通义实验室基于MaxCompute进行大模型数据管理及处理
大数据·人工智能