机器学习-时序预测2

门控循环单元GRU

接着机器学习-时序预测1-CSDN博客这个说,GRU是LSTM的一个简化而高效的变体,都使用"门控机制"来控制信息流,但它通过合并一些组件,使结构更简单、参数更少、计算更快,同时在许多任务上性能与 LSTM 相当甚至更好。

GRU没有了独立的细胞状态,也就是LSTM中的长期记忆,只有一个状态,但是通过"门控机制",让同时承担了长期和短期记忆的功能。而且只剩下了两个核心门控:

更新门,用sigmoid激活函数输出0-1的向量,中每个元素表示多少信息来自,多少信息来自

重置门,用sigmoid激活函数输出0-1的向量,中每个元素表示计算时考虑多少

候选隐藏状态,用到了重置门;

更新最终隐藏状态,用到了更新门,更新门决定了更相信过去还是现在。

同样的,还需要在输出层中对输出进行更新,就像机器学习-时序预测1-CSDN博客

相关推荐
闵孚龙1 分钟前
PyTorch 系列 之 nn.Module:所有模型的骨架
人工智能·pytorch·python
海天一色y4 分钟前
深入理解 Function Calling、MCP 与 Skills:AI Agent 的三层能力架构
人工智能·mcp·skills
小星AI9 分钟前
FastMCP 2.0 实战:10 分钟给 Claude Code 装上手
人工智能·agent
昨日之日200611 分钟前
Higgs Audio v3 - 超自然多语言情感TTS,一键克隆声音 一键整合包下载
人工智能·音视频
zzzzzz31012 分钟前
NVIDIA 开源 SkillSpector:AI Agent 技能安全扫描器,你的 Agent 装了个定时炸弹?
机器学习·shell·cto
极客老王说Agent15 分钟前
2026全业务链条断层破解:智能体如何重构端到端业务闭环
人工智能·ai·chatgpt·重构
云烟成雨TD16 分钟前
Spring AI 1.x 系列【61】Spring AI 2.0 升级指南
java·人工智能·spring
Luhui Dev24 分钟前
几何图,现在可以用 API 一句话生成
人工智能·数学·luhuidev
咕咕AI学堂30 分钟前
大模型应用开发:Prompt Engineering 从经验法则到工程化实践
人工智能
名不经传的养虾人32 分钟前
从0到1:企业级AI项目迭代日记 Vol.47|从“能说”到“能上手”
大数据·人工智能·ai编程·企业ai·多agent协作