机器学习-时序预测2

门控循环单元GRU

接着机器学习-时序预测1-CSDN博客这个说,GRU是LSTM的一个简化而高效的变体,都使用"门控机制"来控制信息流,但它通过合并一些组件,使结构更简单、参数更少、计算更快,同时在许多任务上性能与 LSTM 相当甚至更好。

GRU没有了独立的细胞状态,也就是LSTM中的长期记忆,只有一个状态,但是通过"门控机制",让同时承担了长期和短期记忆的功能。而且只剩下了两个核心门控:

更新门,用sigmoid激活函数输出0-1的向量,中每个元素表示多少信息来自,多少信息来自

重置门,用sigmoid激活函数输出0-1的向量,中每个元素表示计算时考虑多少

候选隐藏状态,用到了重置门;

更新最终隐藏状态,用到了更新门,更新门决定了更相信过去还是现在。

同样的,还需要在输出层中对输出进行更新,就像机器学习-时序预测1-CSDN博客

相关推荐
sali-tec20 小时前
C# 基于halcon的视觉工作流-章62 点云采样
开发语言·图像处理·人工智能·算法·计算机视觉
EAIReport20 小时前
通过数据分析自动化产品实现AI生成PPT的完整流程
人工智能·数据分析·自动化
swanwei20 小时前
量子科技对核心产业的颠覆性影响及落地时间表(全文2500字)
大数据·网络·人工智能·程序人生·量子计算
AKAMAI21 小时前
从 Cloudflare 服务中断,看建立多维度风险应对机制的必要
人工智能·云原生·云计算
道可云21 小时前
道可云人工智能每日资讯|2025青岛虚拟现实创新大会即将举行
人工智能·vr
酷雷曼VR全景21 小时前
身边的变化丨从“尝鲜”到“刚需”,VR全景让生活“立体化”
人工智能·生活·vr·vr全景·酷雷曼·合作商
m0_6501082421 小时前
Flamingo:打破模态壁垒的少样本视觉语言模型
论文阅读·人工智能·视觉语言模型·deepmind·vlm·通用智能·通用小样本适配
gorgeous(๑>؂<๑)21 小时前
【ICLR26匿名投稿】Context-Aware ViT:让目标检测真正“看清上下文”的增强策略
人工智能·目标检测·机器学习·计算机视觉·目标跟踪
AI大模型学徒21 小时前
NLP基础(七)_文本分析与关键词提取
人工智能·自然语言处理
汤姆yu21 小时前
基于深度学习的健康饮食推荐系统
人工智能·深度学习