深度学习pytorch——多层感知机反向传播(持续更新)

在讲解多层感知机反向传播之前,先来回顾一下多输出感知机的问题,下图是一个多输出感知机模型:
课时44 反向传播算法-1_哔哩哔哩_bilibili

根据上一次的分析深度学习pytorch------感知机(Perceptron)(持续更新)-CSDN博客我们得出来了如下的结论,即损失对参数的导数只与这条线(蓝绿色的)有关:

多层感知机就是在原来多输出感知机的基础上增加了中间层,如下图所示:
课时44 反向传播算法-1_哔哩哔哩_bilibili

我们将前面的层次都盖住,从最后一层来看:
课时44 反向传播算法-1_哔哩哔哩_bilibili

这时O就成为了输入,根据多输出感知机的结论,只需要将x变为O,我们可以得到最后一层的计算公式,如下图:

为了是我们的公式更加简单,我们对公式进行了替换(只是改变了公式的表达形式,其内涵并没有改变),如下图所示:

分析求导过程,求导的时候记得我们求的时最后一层,并且注意各下角标的含义(都在深度学习pytorch------感知机(Perceptron)(持续更新)-CSDN博客说明):

求导结果:

总结一下感知机的问题:
课时44 反向传播算法-1_哔哩哔哩_bilibili

pytorch公式的推导到这里基本结束了。经过每一次的公式的推导,我们发现公式都是通过求导问题来分析的,其中不仅含有基本数学公式的求导,还联系到链式法则,如果高数学的还不错,我相信这些都不是问题。

在以后的实践,理解基本原理有助于我们更好的编写深度学习的代码。而且随着人工智能的发展,AI安全问题随之出现,想要做出更棒的智能产品,理解其内部原理,将会更好帮助我们的前进。

相关推荐
DREAM依旧14 分钟前
隐马尔科夫模型|前向算法|Viterbi 算法
人工智能
GocNeverGiveUp27 分钟前
机器学习2-NumPy
人工智能·机器学习·numpy
B站计算机毕业设计超人1 小时前
计算机毕业设计PySpark+Hadoop中国城市交通分析与预测 Python交通预测 Python交通可视化 客流量预测 交通大数据 机器学习 深度学习
大数据·人工智能·爬虫·python·机器学习·课程设计·数据可视化
学术头条1 小时前
清华、智谱团队:探索 RLHF 的 scaling laws
人工智能·深度学习·算法·机器学习·语言模型·计算语言学
18号房客2 小时前
一个简单的机器学习实战例程,使用Scikit-Learn库来完成一个常见的分类任务——**鸢尾花数据集(Iris Dataset)**的分类
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·sklearn
feifeikon2 小时前
机器学习DAY3 : 线性回归与最小二乘法与sklearn实现 (线性回归完)
人工智能·机器学习·线性回归
游客5202 小时前
opencv中的常用的100个API
图像处理·人工智能·python·opencv·计算机视觉
古希腊掌管学习的神2 小时前
[机器学习]sklearn入门指南(2)
人工智能·机器学习·sklearn
Ven%2 小时前
如何在防火墙上指定ip访问服务器上任何端口呢
linux·服务器·网络·深度学习·tcp/ip
凡人的AI工具箱2 小时前
每天40分玩转Django:Django国际化
数据库·人工智能·后端·python·django·sqlite