LSTM基础

LSTM

视频讲得非常好

bash 复制代码
https://www.bilibili.com/video/BV1644y1W7sD/?spm_id_from=333.788&vd_source=3b42b36e44d271f58e90f86679d77db7

门的概念

过去,不过去,过去一部分

点乘,0

concatenation,pointwise

LSTM

RNN

上一时刻的输出+这一时刻的输入

细胞状态长期记忆,隐藏状态短期记忆

Ct---候选值

tensor of shape

(N,L,H)

N---batch_size

L---sequence_len

H---输入的维度


实现

RMSE

均方根误差

相关推荐
TGITCIC2 分钟前
为何大模型都使用decoder-only?
人工智能·大模型·transformer·ai agent·大模型面试·ai面试
ghie90906 分钟前
x-IMU matlab zupt惯性室内定位算法
人工智能·算法·matlab
carpell24 分钟前
【语义分割专栏】先导篇:评价指标(PA,CPA,IoU,mIoU,FWIoU,F1)
人工智能·计算机视觉·语义分割
狂奔solar1 小时前
Westlake-Omni 情感端音频生成式输出模型
人工智能
idkmn_1 小时前
Daily AI 20250513 (集成学习及其与联邦学习的区别)
人工智能·神经网络·机器学习·集成学习
微刻时光1 小时前
影刀RPA网页自动化总结
运维·人工智能·python·低代码·自动化·rpa·影刀rpa
三天不学习2 小时前
浅析AI大模型为何需要向量数据库?【入门基础】
数据库·人工智能·欧氏距离·向量数据库·余弦相似度
WenGyyyL2 小时前
研读论文——《用于3D工业异常检测的自监督特征自适应》
人工智能·python·深度学习·机器学习·计算机视觉·3d
fydw_7152 小时前
音频生成技术的前沿探索:从语音合成到智能Podcast
人工智能·音视频·语音识别
选型宝2 小时前
腾讯怎样基于DeepSeek搭建企业应用?怎样私有化部署满血版DS?直播:腾讯云X DeepSeek!
人工智能·ai·云计算·腾讯云·选型宝