【深度学习】RNN循环神经网络的原理

sentiment analysis,根据评价来判断为好评还是差评。例如I hate this boring movie,每个单词都用一个张量[100]进行表示,整句话就可以用张量[5, 100]进行表示。每个单词经过线性层操作之后(w和b的shape为[100, 2]),与线性层相连接提取特征,抽取高层特征,会得到一个张量[2],经过加和计算可以得到张量[5, 2],进而得到概率值P(pos|x)判断评论的好坏属性。

但是这样的方法存在问题,当句子太长的时候,[w,b]的参数太多。这时候我们可以采用权值共享的方法,把所有的[w, b]用同一个值进行处理,这样会大大减少参数量。

而且没有一个上下语境信息,我们不能一个一个的单词进行处理,而需要看整体的句子,需要持续的协调一致的张量(consistent tensor),存储统一的语境信息。首先,初始化h0,第一个单词不仅输入输入的特征向量 "I",还输入初始值h0的特征向量;第二个单词,输入 "hate"的同时,也输入上一时刻的语境信息 h1;第三个单词,输入 "this"的同时,也输入上一时刻的语境信息 h2。

简化之后,可以得到如果输入特征为[5, 3, 100],一句话有5个单词,有三个句子batch,每个单词用100维的特征向量进表示,输入一句话的时候shape为[3, 100],然后进行不断自我更新,自我更新机制取决于上一时刻的输出和当前输入。

展开之后可以得到:

如何进行训练RNN呢?

相关推荐
Seon塞翁19 分钟前
2025年AI大事记:从 DeepSeek R1 到 MiniMax M2.1,我们改变了什么?
人工智能
小李子不吃李子27 分钟前
人工智能与创新第二章练习题
人工智能·学习
deephub39 分钟前
Lux 上手指南:让 AI 直接操作你的电脑
人工智能·python·大语言模型·agent
byzh_rc1 小时前
[模式识别-从入门到入土] 专栏总结
人工智能·机器学习
yesyesyoucan1 小时前
标题:AI图片背景去除全能站:从复杂场景到透明底图的智能解构方案
人工智能
ai_xiaogui1 小时前
Panelai 深度解析:新一代 AI 服务器管理面板,如何实现闲置算力变现与多租户商业化部署?
人工智能·零基础部署 comfyui·多租户 ai 计费面板·gpu 算力租赁平台搭建·私有化 ai 部署商业方案
LINGYI0001 小时前
什么是品牌全案?新品牌如何制定品牌规划?
人工智能·天猫代运营·品牌全案
AGI_Eval1 小时前
AGI-Eval 2025年度报告精选 | 以数据为尺,度量智能边界
人工智能
策知道1 小时前
从“抗旱保苗”到“修渠引水”:读懂五年财政政策的变奏曲
大数据·数据库·人工智能·搜索引擎·政务
洞见新研社1 小时前
从实验室走向真实世界,2025年具身智能的产业突破与挑战
人工智能