【深度学习】RNN循环神经网络的原理

sentiment analysis,根据评价来判断为好评还是差评。例如I hate this boring movie,每个单词都用一个张量[100]进行表示,整句话就可以用张量[5, 100]进行表示。每个单词经过线性层操作之后(w和b的shape为[100, 2]),与线性层相连接提取特征,抽取高层特征,会得到一个张量[2],经过加和计算可以得到张量[5, 2],进而得到概率值P(pos|x)判断评论的好坏属性。

但是这样的方法存在问题,当句子太长的时候,[w,b]的参数太多。这时候我们可以采用权值共享的方法,把所有的[w, b]用同一个值进行处理,这样会大大减少参数量。

而且没有一个上下语境信息,我们不能一个一个的单词进行处理,而需要看整体的句子,需要持续的协调一致的张量(consistent tensor),存储统一的语境信息。首先,初始化h0,第一个单词不仅输入输入的特征向量 "I",还输入初始值h0的特征向量;第二个单词,输入 "hate"的同时,也输入上一时刻的语境信息 h1;第三个单词,输入 "this"的同时,也输入上一时刻的语境信息 h2。

简化之后,可以得到如果输入特征为[5, 3, 100],一句话有5个单词,有三个句子batch,每个单词用100维的特征向量进表示,输入一句话的时候shape为[3, 100],然后进行不断自我更新,自我更新机制取决于上一时刻的输出和当前输入。

展开之后可以得到:

如何进行训练RNN呢?

相关推荐
悟乙己3 分钟前
构建金融级 AI Agent:Claude for Financial Services 架构解析
人工智能·金融·架构
烈风逍遥26 分钟前
基于 Vue 3+Spring Boot 构建 RAG 智能知识库
人工智能
机器之心27 分钟前
1/10成本、Opus 4.7级表现,Cursor甩出了性价比之王Composer 2.5
人工智能·openai
机器之心32 分钟前
从卖token到卖结果,这些公司开始让AI背KPI了
人工智能·openai
效能革命笔记33 分钟前
AI模型平台选型指南:开源生态与国产算力如何优选
人工智能·开源
机器之心36 分钟前
H100去哪儿了?
人工智能·openai
多年小白39 分钟前
兆易创新分析
大数据·人工智能·ai·金融·区块链
小领航1 小时前
构建 MySQL MCP Server
人工智能·node.js
paperClub1 小时前
AACR 2026 · AI诊断:深度学习在肿瘤早期检测中的应用
人工智能·深度学习
碳基硅坊1 小时前
使用RAGFlow搭建本地知识库
人工智能·知识库·rag·ragflow