lstm基础知识

lstm前言

LSTM(Long short-term memory)通过刻意的设计来避免长期依赖问题,是一种特殊的RNN。长时间记住信息实际上是 LSTM 的默认行为,而不是需要努力学习的东西!

在标准的RNN中,这个重复模块具有非常简单的结构,例如只有单个tanh层,如下图所示。

LSTM具有同样的结构,但是重复的模块拥有不同的结构,如下图所示。与RNN的不同,这里有四个网络层,并且以一种非常特殊的方式进行交互。

公式推导

三个门的作用

ft门的作用是选择性遗忘部分记忆,it门决定了新的知识有哪些需要被记住,意思就是对新知识进行取舍,g(新的记忆单元)根据当前的输入和前一个隐藏状态计算出来的一个潜在的新记忆。它本身并不决定新信息是否要存入细胞状态,而只是提供了一种可能的输入。ot门决定了输出哪些新的知识。

总结

总结:我刚考完高等数学,下一门考线性代数,首先通过遗忘门,进行选择性遗忘旧的知识,然后通过更新门,将旧的知识和已经学习的新的知识进行整合。形成目前所学到的全部知识,然后和输出门进行结合,转化成考试的能力,也就是记住线性代数所要考察的考点,最后输出考试所得的分数。

相关推荐
DuDuTalk2 分钟前
武汉赛思云科技签约汽车之家,DuDuTalk语音工牌助力汽车门店线下服务过程管理智能化
人工智能·自然语言处理·语音识别·录音设备·语音分析
唯创知音19 分钟前
医疗器械设备语音ic芯片方案-选型大全
人工智能·单片机·物联网·智能家居·语音识别
纪怽ぅ39 分钟前
浅谈——深度学习和马尔可夫决策过程
人工智能·python·深度学习·算法·机器学习
设计是门艺术1 小时前
蚂蚁Ant Design:设计师的理想工具
人工智能·ui
NewsMash1 小时前
北京环球金融中心首启“守望秦岭”展览暨户外大熊猫公共装置亮相
人工智能·生活
z千鑫2 小时前
【AI开源项目】FastGPT- 快速部署FastGPT以及使用知识库的两种方式!
人工智能·ai·chatgpt·开源·ai编程·fastgpt·codemoss能用ai
爱数学的程序猿2 小时前
深入探索:深度学习在时间序列预测中的强大应用与实现
人工智能·深度学习·神经网络·机器学习
攻城狮_Dream2 小时前
论文题目:深度学习在自然语言处理中的应用研究
人工智能·深度学习·自然语言处理·本科论文
爱技术的小伙子2 小时前
【ChatGPT】优化ChatGPT生成内容的语言风格与语气
人工智能·chatgpt
神奇夜光杯2 小时前
Python酷库之旅-第三方库Pandas(181)
开发语言·人工智能·python·excel·pandas·标准库及第三方库·学习与成长