什么是RNN(循环神经网络)

什么是RNN(循环神经网络)

循环神经网络(Recurrent Neural Network),在识别图像时,输入的每张图片都是孤立的,认出这张图片是苹果,并不会对认出下一张图片是梨造成影响。

但对语言来说,顺序是十分重要的,"我吃苹果"和"苹果吃我",词语顺序的改变表达了完全不同的意义。顺序也提供了一定的信息,比如"吃"后面大概率是代表食物的名词。

为了捕捉数据的这种关联,人们找到了RNN,一个高度重视序列信息的网络。

序列就是数据的前后关系,RNN的基础结构仍然是神经网络,只不过它多了一个小盒子 ,用来记录数据输入时网络的状态,在下一次输入数据时,网络必须要考虑小盒子中保存的信息,随着数据的一次次输入,存储信息也在不断更新,盒子中的信息被称为隐状态

和开始举出的例子一样,RNN最常见的应用领域就是自然语言处理。

  • 机器翻译是寻找相同的意义序列,在不同语言中的表达。

  • 诗歌生成是基于一个主题,按照一定的规则输出有逻辑的词语序列。改变两端的信息类型,输入图片输出句子,就是看图说话。

  • 语音同样可以看作声音信号按时间顺序组成的序列,语音识别和语音生成同样在RNN的能力范围内。

  • 股票价格也可以被看作一个受时间影响的序列,很多量化交易模型的建立,就是基于这样的认知。

不过,RNN仍有不可忽视的缺陷,数据输入的越早,在隐状态中占据的影响就越小,也就是说如果一个句子很长,RNN就会忘记开始时说了什么。

于是就有了RNN的改良版,LSTM-长短时记忆模型。

相关推荐
青松@FasterAI37 分钟前
【程序员 NLP 入门】词嵌入 - 上下文中的窗口大小是什么意思? (★小白必会版★)
人工智能·自然语言处理
AIGC大时代1 小时前
高效使用DeepSeek对“情境+ 对象 +问题“型课题进行开题!
数据库·人工智能·算法·aigc·智能写作·deepseek
硅谷秋水1 小时前
GAIA-2:用于自动驾驶的可控多视图生成世界模型
人工智能·机器学习·自动驾驶
多巴胺与内啡肽.1 小时前
深度学习--自然语言处理统计语言与神经语言模型
深度学习·语言模型·自然语言处理
偶尔微微一笑1 小时前
AI网络渗透kali应用(gptshell)
linux·人工智能·python·自然语言处理·编辑器
深度之眼1 小时前
2025时间序列都有哪些创新点可做——总结篇
人工智能·深度学习·机器学习·时间序列
晓数2 小时前
【硬核干货】JetBrains AI Assistant 干货笔记
人工智能·笔记·jetbrains·ai assistant
jndingxin2 小时前
OpenCV 图形API(60)颜色空间转换-----将图像从 YUV 色彩空间转换为 RGB 色彩空间函数YUV2RGB()
人工智能·opencv·计算机视觉
Sherlock Ma2 小时前
PDFMathTranslate:基于LLM的PDF文档翻译及双语对照的工具【使用教程】
人工智能·pytorch·语言模型·pdf·大模型·机器翻译·deepseek
知舟不叙2 小时前
OpenCV中的SIFT特征提取
人工智能·opencv·计算机视觉