【LSTM和GRU极简,和最新的TT也就是状态】机器学习模型来学习状态

LSTM(长短期记忆网络)中的关键参数包括输入门、遗忘门、输出门、细胞状态和隐藏状态。以下是如何进行推理计算的示例:

LSTM参数和公式

  1. 输入门(i_t) :决定输入的信息量。

  2. 遗忘门(f_t) :决定遗忘上一个状态的信息量。

  3. 细胞状态(C_t) :存储长期信息。

  4. 输出门(o_t) :决定输出的信息量。

  5. 隐藏状态(h_t) :输出短期记忆。

推理计算示例

假设我们有以下输入数据和参数:

计算步骤

总结:训练所得四个权重,然后不停的更新状态,遗忘并输出

GRU 少了门,更新,重置,状态 3个权重。

相关推荐
香蕉也是布拉拉3 分钟前
2026-05-29 arXiv 论文带读:GeoAI、空间智能与多模态 Agent 的 9 篇高质量新作
人工智能·机器学习
还不秃顶的计科生3 小时前
codex配置自动化visio/ppt
机器学习·visio
春日见3 小时前
五分钟入门 强化学习---Q-Learning算法与实现
人工智能·python·深度学习·算法·机器学习·计算机视觉
多年小白3 小时前
【周末消息】2026年5月30日-6月1日
大数据·人工智能·深度学习·机器学习·金融
Mikowoo0074 小时前
机器学习_梯度计算
人工智能·python·机器学习
_Oracle5 小时前
机器学习——归纳偏好
人工智能·机器学习
MRDONG17 小时前
从机器学习到大语言模型:一文讲清 AI、Transformer、Embedding 和向量数据库
人工智能·机器学习·语言模型
城事漫游Molly7 小时前
AI与质性研究的融合(三):AI赋能质性数据分析——从编码到理论构建的新范式
大数据·人工智能·机器学习·prompt·ai for science·智能体·定性研究
大模型最新论文速读8 小时前
SkillOpt:把 skill 文档当成模型权重来训练
论文阅读·人工智能·深度学习·机器学习·自然语言处理
Omics Pro9 小时前
基因泰克:检测级虚拟细胞基准!大语言模型+智能体
大数据·数据库·人工智能·机器学习·语言模型·自然语言处理·r语言