神经网络与深度学习(一)误差反传BP算法

误差反传BP算法

1多层感知机

1.1XOR问题

线性不可分问题: 无法进行线性分类。

Minsky 1969 年提出 XOR 问题

解决方法:使用多层感知机 使用多层感知机

1.2多层感知机

• 在输入和输出层间加一或多隐单元,构成多层感知器(多层前馈神经网络)

• 加一层隐节点( 单元)为三层网络,可解决异或XOR )问题

由输入得到两个隐节点、一个输出层节点的输出:

可得到:

设网络有如下一组权值和阈值,可得各节点的输出:

三层感知器可识别任一凸多边形或无界的区域。

更多层感知器网络,可识别为复杂的图形。

2.BP算法

2.1简述


多层感知机是一种多层前馈网络, 由多层神经网络构成,每层网络将输出传递给下一层网络。神经元间的权值连接仅现在相邻之间, 不出现在其他位置。如果每一个神经元都连接到上层的所有(除输入层外),则成为全连接网络 。

多层前馈网络的反向传播 (BP) 学习算法,简称BP算法 ,是有导师的学习,它是梯度下降法在多层前馈网中的应用。

网络结构:见上图,u(或x)、y是网络的输入、输出向量,神经元用节点表示,网络由输入层、隐层和输出层节点组成,隐层可一层也可多层 (图中是单隐层) ,前层至后层节点通过权联接。由于用BP学习算法,所以常称BP神经网络。

  • 正向传播是输入信号从输入层经隐层,传向输出层,若输出层得到了期望的输出,则学习算法结束;否则,转至反向传播。
  • 反向传播是将误差(样本输出与网络输出之差) 按原联接通路反向计算,由梯度下降法调整各层节点的权值和闽值,使误差减少

2.2详解

2.2.1输入输出模型

假设网络共有L层,(输入层为第0层,输出为第L层)

层:用上标[l]表示,共L层;

2.2.2梯度下降算法迭代


网络训练的目的,是使对每一个输入样本,调整网络权值参数w,使输出均方误差最小化。这是一个最优化问题。

为求解上述最小化问题,考虑迭代算法
这就是梯度下降算法,也是BP学习算法的基本思想

2.2.3前向传播在输出端计算误差

考虑二层神经网络(有一层隐含层):

对于第1层第i个神经元,其输出:

在输出端计算误差

2.2.4误差反传--输出层



2.2.5误差反传--隐含层




即误差进行反向传播

2.2.6误差反传--总结

相关推荐
jjyangyou1 分钟前
物联网核心安全系列——物联网安全需求
物联网·算法·安全·嵌入式·产品经理·硬件·产品设计
wangyue418 分钟前
c# 深度模型入门
深度学习
van叶~18 分钟前
算法妙妙屋-------1.递归的深邃回响:二叉树的奇妙剪枝
c++·算法
简简单单做算法19 分钟前
基于Retinex算法的图像去雾matlab仿真
算法·matlab·图像去雾·retinex
川石课堂软件测试31 分钟前
性能测试|docker容器下搭建JMeter+Grafana+Influxdb监控可视化平台
运维·javascript·深度学习·jmeter·docker·容器·grafana
云卓SKYDROID34 分钟前
除草机器人算法以及技术详解!
算法·机器人·科普·高科技·云卓科技·算法技术
985小水博一枚呀39 分钟前
【深度学习滑坡制图|论文解读3】基于融合CNN-Transformer网络和深度迁移学习的遥感影像滑坡制图方法
人工智能·深度学习·神经网络·cnn·transformer
985小水博一枚呀44 分钟前
【深度学习滑坡制图|论文解读2】基于融合CNN-Transformer网络和深度迁移学习的遥感影像滑坡制图方法
人工智能·深度学习·神经网络·cnn·transformer·迁移学习
数据与后端架构提升之路1 小时前
从神经元到神经网络:深度学习的进化之旅
人工智能·神经网络·学习
半盏茶香1 小时前
【C语言】分支和循环详解(下)猜数字游戏
c语言·开发语言·c++·算法·游戏