深度学习与神经网络 | 邱锡鹏 | 第六章学习笔记循环神经网络

丶Darling.2025-06-24 15:42

6.循环神经网络

文章目录

6.循环神经网络
- [6.1 给神经网络增加记忆能力](#6.1 给神经网络增加记忆能力)
- [6.2 循环神经网络](#6.2 循环神经网络)
- [6.3 应用到机器学习](#6.3 应用到机器学习)
- [6.4 参数学习](#6.4 参数学习)
- [6.5 如何解决长程依赖问题](#6.5 如何解决长程依赖问题)
- [6.6 GRU 和 LSTM](#6.6 GRU 和 LSTM)
- [6.7 深层循环神经网络](#6.7 深层循环神经网络)
- [6.8 应用](#6.8 应用)
- [6.9 扩展到图结构](#6.9 扩展到图结构)

6.1 给神经网络增加记忆能力

6.2 循环神经网络

6.3 应用到机器学习

s是单个词的意思，b是一个词的开始，e是一个词的结束

没有结果产生的部分就是编码部分，有结果产生的部分就是解码部分

这是之前说的自回归模型

6.4 参数学习

会让第t个时刻的时候收不到关于第k个时刻的损失对地t个时刻的影响原因就是梯度爆炸或者梯度消失

6.5 如何解决长程依赖问题

让上图的伽马=1即可，但是这个条件很强，很难达到

6.6 GRU 和 LSTM

ft是遗忘门，说的是我们这次应该忘记多少信息

6.7 深层循环神经网络

就是多叠了几层

6.8 应用

6.9 扩展到图结构

上一篇：快速手搓一个MCP服务指南（一）：FastMCP 快速入门指南详解

下一篇：WebSocket快速入门

热门推荐

01BongoCat - 跨平台键盘猫动画工具 02GitHub 镜像站点 03UV安装并设置国内源 04Linux下V2Ray安装配置指南 05GitLab 零基础入门指南：从安装到项目管理全流程 06jdk21下载、安装（Windows、Linux、macOS）07NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 08HTML5 敲击乐：从零搭建交互式前端音乐项目 09KGG转MP3工具|非KGM文件|解密音频 10安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）