【LSTM和GRU极简,和最新的TT也就是状态】机器学习模型来学习状态

LSTM(长短期记忆网络)中的关键参数包括输入门、遗忘门、输出门、细胞状态和隐藏状态。以下是如何进行推理计算的示例:

LSTM参数和公式

  1. 输入门(i_t) :决定输入的信息量。

  2. 遗忘门(f_t) :决定遗忘上一个状态的信息量。

  3. 细胞状态(C_t) :存储长期信息。

  4. 输出门(o_t) :决定输出的信息量。

  5. 隐藏状态(h_t) :输出短期记忆。

推理计算示例

假设我们有以下输入数据和参数:

计算步骤

总结:训练所得四个权重,然后不停的更新状态,遗忘并输出

GRU 少了门,更新,重置,状态 3个权重。

相关推荐
你觉得20515 小时前
哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义下载方法
大数据·人工智能·python·gpt·学习·机器学习·aigc
IT猿手16 小时前
基于CNN-LSTM的深度Q网络(Deep Q-Network,DQN)求解移动机器人路径规划,MATLAB代码
网络·cnn·lstm
向上的车轮17 小时前
NOA是什么?国内自动驾驶技术的现状是怎么样的?
人工智能·机器学习·自动驾驶
你觉得20518 小时前
浙江大学朱霖潮研究员:《人工智能重塑科学与工程研究》以蛋白质结构预测为例|附PPT下载方法
大数据·人工智能·机器学习·ai·云计算·aigc·powerpoint
人工干智能19 小时前
科普:One-Class SVM和SVDD
人工智能·机器学习·支持向量机
MPCTHU19 小时前
预测分析(三):基于机器学习的分类预测
人工智能·机器学习·分类
_一条咸鱼_19 小时前
LangChain 入门到精通
机器学习
3DVisionary20 小时前
3D-DIC与机器学习协同模拟材料应力-应变本构行为研究
人工智能·机器学习·3d·3d-dic技术 机器学习·应力-应变本构行为·卷积神经网络(ecnn)·数字图像相关法(dic)
神经星星20 小时前
无需预对齐即可消除批次效应,东京大学团队开发深度学习框架STAIG,揭示肿瘤微环境中的详细基因信息
人工智能·深度学习·机器学习
神经星星20 小时前
【vLLM 学习】调试技巧
人工智能·机器学习·编程语言