LSTM基础

LSTM

视频讲得非常好

bash 复制代码
https://www.bilibili.com/video/BV1644y1W7sD/?spm_id_from=333.788&vd_source=3b42b36e44d271f58e90f86679d77db7

门的概念

过去,不过去,过去一部分

点乘,0

concatenation,pointwise

LSTM

RNN

上一时刻的输出+这一时刻的输入

细胞状态长期记忆,隐藏状态短期记忆

Ct---候选值

tensor of shape

(N,L,H)

N---batch_size

L---sequence_len

H---输入的维度


实现

RMSE

均方根误差

相关推荐
DeanWinchester_mh5 分钟前
DeepSeek新论文火了:不用卷算力,一个数学约束让大模型更聪明
人工智能·学习
dixiuapp6 分钟前
学校后勤报修系统哪个好,如何选择
大数据·人工智能·工单管理系统·院校工单管理系统·物业报修系统
魔乐社区6 分钟前
MindSpeed LLM适配Qwen3-Coder-Next并上线魔乐社区,训练推理教程请查收
人工智能·深度学习·机器学习
大傻^8 分钟前
混合专家系统(MoE)深度解析:从原理到Mixtral AI工程实践
人工智能·混合专家系统·mixtral ai
code bean17 分钟前
【AI 】OpenSpec 实战指南:在 Cursor 中落地 AI 原生开发工作流
人工智能·cursor·ai工作流·openspec
多恩Stone24 分钟前
【3D AICG 系列-6】OmniPart 训练流程梳理
人工智能·pytorch·算法·3d·aigc
江瀚视野25 分钟前
多家银行向甲骨文断贷,巨头甲骨文这是怎么了?
大数据·人工智能
ccLianLian27 分钟前
计算机基础·cs336·损失函数,优化器,调度器,数据处理和模型加载保存
人工智能·深度学习·计算机视觉·transformer
asheuojj28 分钟前
2026年GEO优化获客效果评估指南:如何精准衡量TOP5关
大数据·人工智能·python
多恩Stone29 分钟前
【RoPE】Flux 中的 Image Tokenization
开发语言·人工智能·python