深度学习pytorch——多层感知机反向传播(持续更新)

在讲解多层感知机反向传播之前,先来回顾一下多输出感知机的问题,下图是一个多输出感知机模型:
课时44 反向传播算法-1_哔哩哔哩_bilibili

根据上一次的分析深度学习pytorch------感知机(Perceptron)(持续更新)-CSDN博客我们得出来了如下的结论,即损失对参数的导数只与这条线(蓝绿色的)有关:

多层感知机就是在原来多输出感知机的基础上增加了中间层,如下图所示:
课时44 反向传播算法-1_哔哩哔哩_bilibili

我们将前面的层次都盖住,从最后一层来看:
课时44 反向传播算法-1_哔哩哔哩_bilibili

这时O就成为了输入,根据多输出感知机的结论,只需要将x变为O,我们可以得到最后一层的计算公式,如下图:

为了是我们的公式更加简单,我们对公式进行了替换(只是改变了公式的表达形式,其内涵并没有改变),如下图所示:

分析求导过程,求导的时候记得我们求的时最后一层,并且注意各下角标的含义(都在深度学习pytorch------感知机(Perceptron)(持续更新)-CSDN博客说明):

求导结果:

总结一下感知机的问题:
课时44 反向传播算法-1_哔哩哔哩_bilibili

pytorch公式的推导到这里基本结束了。经过每一次的公式的推导,我们发现公式都是通过求导问题来分析的,其中不仅含有基本数学公式的求导,还联系到链式法则,如果高数学的还不错,我相信这些都不是问题。

在以后的实践,理解基本原理有助于我们更好的编写深度学习的代码。而且随着人工智能的发展,AI安全问题随之出现,想要做出更棒的智能产品,理解其内部原理,将会更好帮助我们的前进。

相关推荐
qq_416276422 小时前
LOFAR物理频谱特征提取及实现
人工智能
Python图像识别3 小时前
71_基于深度学习的布料瑕疵检测识别系统(yolo11、yolov8、yolov5+UI界面+Python项目源码+模型+标注好的数据集)
python·深度学习·yolo
余俊晖3 小时前
如何构造一个文档解析的多模态大模型?MinerU2.5架构、数据、训练方法
人工智能·文档解析
Akamai中国4 小时前
Linebreak赋能实时化企业转型:专业系统集成商携手Akamai以实时智能革新企业运营
人工智能·云计算·云服务
LiJieNiub5 小时前
读懂目标检测:从基础概念到主流算法
人工智能·计算机视觉·目标跟踪
哥布林学者5 小时前
吴恩达深度学习课程一:神经网络和深度学习 第三周:浅层神经网络(二)
深度学习·ai
weixin_519535775 小时前
从ChatGPT到新质生产力:一份数据驱动的AI研究方向指南
人工智能·深度学习·机器学习·ai·chatgpt·数据分析·aigc
爱喝白开水a6 小时前
LangChain 基础系列之 Prompt 工程详解:从设计原理到实战模板_langchain prompt
开发语言·数据库·人工智能·python·langchain·prompt·知识图谱
takashi_void6 小时前
如何在本地部署大语言模型(Windows,Mac,Linux)三系统教程
linux·人工智能·windows·macos·语言模型·nlp
OpenCSG6 小时前
【活动预告】2025斗拱开发者大会,共探支付与AI未来
人工智能·ai·开源·大模型·支付安全