【深度学习】RNN循环神经网络的原理

sentiment analysis,根据评价来判断为好评还是差评。例如I hate this boring movie,每个单词都用一个张量100进行表示,整句话就可以用张量5, 100进行表示。每个单词经过线性层操作之后(w和b的shape为100, 2),与线性层相连接提取特征,抽取高层特征,会得到一个张量2,经过加和计算可以得到张量5, 2,进而得到概率值P(pos|x)判断评论的好坏属性。

但是这样的方法存在问题,当句子太长的时候,w,b的参数太多。这时候我们可以采用权值共享的方法,把所有的w, b用同一个值进行处理,这样会大大减少参数量。

而且没有一个上下语境信息,我们不能一个一个的单词进行处理,而需要看整体的句子,需要持续的协调一致的张量(consistent tensor),存储统一的语境信息。首先,初始化h0,第一个单词不仅输入输入的特征向量 "I",还输入初始值h0的特征向量;第二个单词,输入 "hate"的同时,也输入上一时刻的语境信息 h1;第三个单词,输入 "this"的同时,也输入上一时刻的语境信息 h2。

简化之后,可以得到如果输入特征为5, 3, 100,一句话有5个单词,有三个句子batch,每个单词用100维的特征向量进表示,输入一句话的时候shape为3, 100,然后进行不断自我更新,自我更新机制取决于上一时刻的输出和当前输入。

展开之后可以得到:

如何进行训练RNN呢?

相关推荐
王牌狮AIen10 小时前
合规生命线——警惕“AI投毒”与算法陷阱,如何为品牌装上“事前免疫”系统?
大数据·人工智能·数据挖掘·geo·ai营销
糖果店的幽灵10 小时前
Spring AI 从入门到精通-结构化输出
java·人工智能·spring
大树8810 小时前
PUE 超 1.35 要多交多少?存量机房液冷改造 3 张算账表
大数据·运维·服务器·人工智能
力学与人工智能10 小时前
JHD | 西湖大学冯浩东、范迪夏等:仿生鱼穿越漩涡流场的高效导航策略研究
人工智能·西湖大学·仿生鱼·旋涡流场·导航策略
下班走回家10 小时前
AI 时代的编程教育:还需要学编程吗?
人工智能
X54先生(人文科技)11 小时前
《元创力》纪实录·卷宗 2.2烛火传递:硅基纪元的第一个黎明
人工智能·深度学习·开源·ai写作
Bode_200211 小时前
新能源电池包的柔性智能装配质量控制方法
人工智能·机器人·汽车·制造
林爷万福11 小时前
机器学习在光谱分析中的应用:Python实现
人工智能·python·机器学习
三更两点11 小时前
AI拉呱-技术洞察 - 2026-06-01
数据库·人工智能·技术洞察
卡梅德生物科技小能手11 小时前
LTA(淋巴毒素α):免疫调控的关键靶点与机制解析
人工智能·经验分享·机器学习