【趣谈】BP神经网络是如何演变出RNN神经网络的

本文来自《老饼讲解-BP神经网络》https://www.bbbdata.com/

目录

有些朋友学习了BP神经网络,却认为RNN很遥远,或者有些朋友学了RNN,却不知它的意义,这两者差不多就是同一个东西,因此不妨来聊聊BP是如何演变出RNN的,以此加深对两者的了解。

一、BP神经网络是什么

一般最常用的是三层的BP神经网络,它只要隐节点足够多就足以拟合任意曲线。

如果从它的数学表达式来看,就更容易理解它的意义了:

是的,BP神经网络简单来说就只是用多个tansig函数来拟合目标函数。

如果要简洁地总结BP神经网络是什么,那就是"一个可以拟合任意函数的模型"

二、BP神经网络如何解决序列预测问题

序列数据的后一个数据与前面的数据相关,这是序列数据的特性。例如房价就是序列数据,每月的房价不仅受当前市场各种因素的影响,它还与上个月的房价紧密相关。

2.1. BP解决序列预测-Jordan神经网络

要用bp神经网络预测序列数据,最简易的思路就是把前一个数据的输出加入到当前数据中作为输入变量,因为当前的输出不仅受x的影响,还受之前的y的影响:

没错,就是这么简单,就诞生了最初代的循环神经网络-Jordan神经网络。

2.2.RNN神经网络

而Elman则提出,不要把上一时刻的y加到隐层,而是把上一时刻的隐层加到当前隐层

为啥要用上一时刻的隐层来替代y呢?因为y就是隐层计算得到的,可见隐层是"更原始"的变量,这样对信息的使用更为充分。没错,Elman的这一改动可以说是个壮举,太实用了,所以都不叫Elman神经网络了,直接称为"RNN神经网络"或"基础RNN神经网络"。

RNN一般按时序展开,就如下图所示:

它实际就是一个三层的BP神经网络,然后每层除了实时输入X,还接受来自上一层的隐层作为延迟输入。RNN就是如此简单,实际就是"用于解决序列预测的BP神经网络"。

BP神经网络是一个非常有趣的东西,不仅它自身在曲线拟合上取得的极佳效果,它还生了几个儿子:CNN,RNN,编码器,个个儿子都这么出色。


相关链接:

《老饼讲解-机器学习》:老饼讲解-机器学习教程-通俗易懂

《老饼讲解-神经网络》:老饼讲解-matlab神经网络-通俗易懂

《老饼讲解-神经网络》:老饼讲解-深度学习-通俗易懂

相关推荐
井底哇哇4 小时前
ChatGPT是强人工智能吗?
人工智能·chatgpt
Coovally AI模型快速验证4 小时前
MMYOLO:打破单一模式限制,多模态目标检测的革命性突破!
人工智能·算法·yolo·目标检测·机器学习·计算机视觉·目标跟踪
AI浩5 小时前
【面试总结】FFN(前馈神经网络)在Transformer模型中先升维再降维的原因
人工智能·深度学习·计算机视觉·transformer
可为测控5 小时前
图像处理基础(4):高斯滤波器详解
人工智能·算法·计算机视觉
一水鉴天5 小时前
为AI聊天工具添加一个知识系统 之63 详细设计 之4:AI操作系统 之2 智能合约
开发语言·人工智能·python
倔强的石头1065 小时前
解锁辅助驾驶新境界:基于昇腾 AI 异构计算架构 CANN 的应用探秘
人工智能·架构
佛州小李哥6 小时前
Agent群舞,在亚马逊云科技搭建数字营销多代理(Multi-Agent)(下篇)
人工智能·科技·ai·语言模型·云计算·aws·亚马逊云科技
说私域6 小时前
社群裂变+2+1链动新纪元:S2B2C小程序如何重塑企业客户管理版图?
大数据·人工智能·小程序·开源
程序猿阿伟7 小时前
《探秘鸿蒙Next:如何保障AI模型轻量化后多设备协同功能一致》
人工智能·华为·harmonyos
2401_897579657 小时前
AI赋能Flutter开发:ScriptEcho助你高效构建跨端应用
前端·人工智能·flutter