深度学习与神经网络 | 邱锡鹏 | 第六章学习笔记 循环神经网络

6.循环神经网络

文章目录

  • 6.循环神经网络
    • [6.1 给神经网络增加记忆能力](#6.1 给神经网络增加记忆能力)
    • [6.2 循环神经网络](#6.2 循环神经网络)
    • [6.3 应用到机器学习](#6.3 应用到机器学习)
    • [6.4 参数学习](#6.4 参数学习)
    • [6.5 如何解决长程依赖问题](#6.5 如何解决长程依赖问题)
    • [6.6 GRU 和 LSTM](#6.6 GRU 和 LSTM)
    • [6.7 深层循环神经网络](#6.7 深层循环神经网络)
    • [6.8 应用](#6.8 应用)
    • [6.9 扩展到图结构](#6.9 扩展到图结构)

6.1 给神经网络增加记忆能力

6.2 循环神经网络

6.3 应用到机器学习

s是单个词的意思,b是一个词的开始,e是一个词的结束

没有结果产生的部分就是编码部分,有结果产生的部分就是解码部分

这是之前说的自回归模型

6.4 参数学习

会让第t个时刻的时候收不到关于第k个时刻的损失对地t个时刻的影响 原因就是梯度爆炸或者梯度消失

6.5 如何解决长程依赖问题

让上图的伽马=1即可,但是这个条件很强,很难达到

6.6 GRU 和 LSTM

ft是遗忘门,说的是我们这次应该忘记多少信息

6.7 深层循环神经网络

就是多叠了几层

6.8 应用

6.9 扩展到图结构

相关推荐
im_AMBER5 小时前
Leetcode 74 K 和数对的最大数目
数据结构·笔记·学习·算法·leetcode
DBA小马哥5 小时前
Oracle迁移实战:如何轻松跨越异构数据库的学习与技术壁垒
数据库·学习·oracle·信创·国产化平替
Blossom.1185 小时前
基于Embedding+图神经网络的开源软件供应链漏洞检测:从SBOM到自动修复的完整实践
人工智能·分布式·深度学习·神经网络·copilot·开源软件·embedding
V1ncent Chen6 小时前
机器是如何“洞察“世界的?:深度学习
人工智能·深度学习
【上下求索】6 小时前
学习笔记095——Ubuntu 安装 lrzsz 服务?
运维·笔记·学习·ubuntu
2401_834517077 小时前
AD学习笔记-27 泪滴的添加和移除
笔记·学习
rit84324997 小时前
基于MATLAB的BP神经网络手写数字识别
开发语言·神经网络·matlab
灰灰勇闯IT8 小时前
RN路由与状态管理:打造多页面应用
开发语言·学习·rn路由状态
java1234_小锋8 小时前
Transformer 大语言模型(LLM)基石 - Transformer架构详解 - 掩码机制(Masked)原理介绍以及算法实现
深度学习·语言模型·transformer
思成不止于此9 小时前
【MySQL 零基础入门】DQL 核心语法(四):执行顺序与综合实战 + DCL 预告篇
数据库·笔记·学习·mysql