机器学习-时序预测2

门控循环单元GRU

接着机器学习-时序预测1-CSDN博客这个说,GRU是LSTM的一个简化而高效的变体,都使用"门控机制"来控制信息流,但它通过合并一些组件,使结构更简单、参数更少、计算更快,同时在许多任务上性能与 LSTM 相当甚至更好。

GRU没有了独立的细胞状态,也就是LSTM中的长期记忆,只有一个状态,但是通过"门控机制",让同时承担了长期和短期记忆的功能。而且只剩下了两个核心门控:

更新门,用sigmoid激活函数输出0-1的向量,中每个元素表示多少信息来自,多少信息来自

重置门,用sigmoid激活函数输出0-1的向量,中每个元素表示计算时考虑多少

候选隐藏状态,用到了重置门;

更新最终隐藏状态,用到了更新门,更新门决定了更相信过去还是现在。

同样的,还需要在输出层中对输出进行更新,就像机器学习-时序预测1-CSDN博客

相关推荐
TImCheng06097 小时前
零基础AI认证学习路径:线上课程与考试机制分析
人工智能
捧 花7 小时前
Claude Code 使用指南
人工智能·claude·claude code·superpower
量子-Alex7 小时前
【大模型】监督微调与强化学习:大型语言模型后训练方法的研究
人工智能·语言模型·自然语言处理
暗夜猎手-大魔王7 小时前
转载--AI Agent 架构设计:记忆污染(OpenClaw、Claude Code、Hermes Agent 对比)
人工智能
2zcode7 小时前
面向健身与康复训练的基于深度学习的人体姿态检测与动作纠正系统
人工智能·深度学习·智能电视
HIT_Weston7 小时前
66、【Agent】【OpenCode】用户对话提示词(Agent 主动性)
人工智能·agent·opencode
Chengbei117 小时前
轻量化 Web 安全日志分析神器 星川智盾日志威胁检测、地理溯源、MITRE ATT&CK 映射,支持 Windows/macOS/Linux
前端·人工智能·安全·web安全·macos·系统安全·安全架构
久菜盒子工作室8 小时前
中国工业气体行业研究报告(2026)
大数据·人工智能
GISer_Jing8 小时前
AI时代面试新常态——从“会用工具”到“深挖原理”的跨越
前端·人工智能·ai编程
IT_陈寒8 小时前
React的useEffect把我坑惨了,这些闭包陷阱真要命
前端·人工智能·后端