动手学深度学习54 循环神经网络

动手学深度学习54 循环神经网络

  • [1. 循环神经网络RNN](#1. 循环神经网络RNN)
    • [2. QA](#2. QA)

1. 循环神经网络RNN

h t h_t ht 与 h t − 1 h_{t-1} ht−1 x t − 1 x_{t-1} xt−1有关
x t x_t xt 与 h t h_t ht x t − 1 x_{t-1} xt−1 有关

怎么把潜变量变成RNN--假设更简单

潜变量和隐变量的区别:隐变量通常是现实生活中存在的东西,只是我们没有观察到;潜变量可指代现实生活中不存在(人为创造)的东西。

隐变量:一个向量。

输出【o_t】发生在观察【x_t】之前。根据o_t和x_t的值计算损失。

φ:激活函数。输出不需要激活函数。

RNN: 在MLP中加了一项 W h h h t − 1 W_{hh}h_{t-1} Whhht−1, 和前一个时间状态的 h t − 1 h_{t-1} ht−1发生关系。所有x的信息都存储到h里面。 W h h W_{hh} Whh存储时序信息。

n个输出的多分类交叉熵损失平均值,再取指数--困惑度。

做指数,损失数值会变大。

困惑度=1,下面候选词词概率最高。=2 候选两个词都很有可能。

clipping

g:表示所有层的梯度放在一起

theta:=5 或者=10

g值正常,不做处理,g过大,将值处理成theta,保证g不会过大--不会超过theta值,防止梯度爆炸。

可视化RNN:
https://www.bilibili.com/video/BV1z5411f7Bm/?vd_source=eb04c9a33e87ceba9c9a2e5f09752ef8

2. QA

循环神经网络可以认为是一个简单的递归网络。递归理解为何树一样的东西。

14: tracking? 目标追踪

相关推荐
心疼你的一切4 分钟前
解锁CANN仓库核心能力:从零搭建AIGC轻量文本生成实战(附代码+流程图)
数据仓库·深度学习·aigc·流程图·cann
初恋叫萱萱5 分钟前
CANN 生态中的图优化引擎:深入 `ge` 项目实现模型自动调优
人工智能
不爱学英文的码字机器6 分钟前
深度解读CANN生态核心仓库——catlass,打造高效可扩展的分类器技术底座
人工智能·cann
Kiyra6 分钟前
作为后端开发你不得不知的 AI 知识——RAG
人工智能·语言模型
共享家952710 分钟前
Vibe Coding 与 LangChain、LangGraph 的协同进化
人工智能
dvlinker12 分钟前
2026远程桌面安全白皮书:ToDesk/TeamViewer/向日葵核心安全性与合规性横向测评
人工智能
2的n次方_13 分钟前
CANN ascend-transformer-boost 深度解析:针对大模型的高性能融合算子库与算力优化机制
人工智能·深度学习·transformer
熊猫_豆豆14 分钟前
YOLOP车道检测
人工智能·python·算法
nimadan1215 分钟前
**热门短剧小说扫榜工具2025推荐,精准捕捉爆款趋势与流量
人工智能·python
qq_124987075318 分钟前
基于JavaWeb的大学生房屋租赁系统(源码+论文+部署+安装)
java·数据库·人工智能·spring boot·计算机视觉·毕业设计·计算机毕业设计