【深度学习】RNN循环神经网络的原理

sentiment analysis,根据评价来判断为好评还是差评。例如I hate this boring movie,每个单词都用一个张量[100]进行表示,整句话就可以用张量[5, 100]进行表示。每个单词经过线性层操作之后(w和b的shape为[100, 2]),与线性层相连接提取特征,抽取高层特征,会得到一个张量[2],经过加和计算可以得到张量[5, 2],进而得到概率值P(pos|x)判断评论的好坏属性。

但是这样的方法存在问题,当句子太长的时候,[w,b]的参数太多。这时候我们可以采用权值共享的方法,把所有的[w, b]用同一个值进行处理,这样会大大减少参数量。

而且没有一个上下语境信息,我们不能一个一个的单词进行处理,而需要看整体的句子,需要持续的协调一致的张量(consistent tensor),存储统一的语境信息。首先,初始化h0,第一个单词不仅输入输入的特征向量 "I",还输入初始值h0的特征向量;第二个单词,输入 "hate"的同时,也输入上一时刻的语境信息 h1;第三个单词,输入 "this"的同时,也输入上一时刻的语境信息 h2。

简化之后,可以得到如果输入特征为[5, 3, 100],一句话有5个单词,有三个句子batch,每个单词用100维的特征向量进表示,输入一句话的时候shape为[3, 100],然后进行不断自我更新,自我更新机制取决于上一时刻的输出和当前输入。

展开之后可以得到:

如何进行训练RNN呢?

相关推荐
编码小哥1 分钟前
OpenCV光流估计:运动检测与跟踪
人工智能·计算机视觉·目标跟踪
QBoson3 分钟前
水处理AI突破小样本困境:VAE数据增强让污染物降解预测精度达88%
人工智能
浅川.255 分钟前
机器学习基础知识
人工智能·机器学习
永远都不秃头的程序员(互关)7 分钟前
深度解密自注意力机制:AI模型“聚焦”能力的核心奥秘与实践
人工智能
zhengfei6117 分钟前
与人工智能安全相关的优质资源
人工智能·安全
TGITCIC8 分钟前
LangGraph:让AI学会“回头是岸”的智能体架构
人工智能·rag·ai agent·图搜索·ai智能体·langgraph·graphrag
2501_941329728 分钟前
家庭日常物品目标检测与识别系统实现_MaskRCNN改进模型应用
人工智能·目标检测·计算机视觉
打小就很皮...10 分钟前
Claude + Skills 快速生成PPT
人工智能·claude·skills
过期的秋刀鱼!12 分钟前
机器学习-正则化线性回归
人工智能·深度学习·机器学习·大模型·线性回归·过拟合和欠拟合·大模型调参
_codemonster13 分钟前
计算机视觉入门到实战系列(十七)基于视觉词袋模型的图像分类算法--视觉词典构建
机器学习·计算机视觉·分类