深度学习记录--计算图(前向后向传播)

什么是计算图?

从一个例子入手:

将函数J的计算用流程图表示出来,这样的流程图被称为计算图

简单来说,计算图是用来显示每个变量间的关系的一种图

两种传播方式

计算图有两种传播方式:前向传播后向传播

什么是前向传播?

还是以函数为例,前向传播就是将计算函数J的值的每一个过程表示出来,类似分步计算

什么是后向传播?

后向传播就是从最后一个方框开始,逐步向前求最终输出变量 (FinalOutput Variable )对普通变量(variable )的导数,记为: ,在函数的例子中,最终输出变量是变量J的值,所以导数写为: ,在编程代码中,为了简便,通常将导数记作: ,当我们求出对所有普通变量的导数后,我们也就清楚了每个变量对于变化的影响程度,同时,这些导数也可以用来更新 变量(即梯度下降法),方便进行迭代计算

后向传播的计算方法

简要来说,就是求导

但是,我们可以利用链式法则 (chain rule)来简化计算

比如:当我们求完 之后,之后我们要求 ,可以进行拆分 ,拆分成: , 这样我们只需要求 ,并将上一次求出的 代入即可求出

同理之后每个导数都可以拆分成两个导数,进行简化运算

相关推荐
有为少年16 分钟前
从独立性、相关性到复杂动力系统
人工智能·深度学习·机器学习·数学建模
阿里云大数据AI技术16 分钟前
【新模型速递】PAI-Model Gallery云上一键部署Qwen3.5模型
人工智能
KG_LLM图谱增强大模型19 分钟前
AgentRxiv:迈向协作式自主科学研究新范式
人工智能·知识图谱
人工智能培训23 分钟前
超级人工智能(AGI)是否是大模型的必然发展方向?
人工智能·深度学习·逻辑回归·agi·具身智能·大模型应用工程师·企业ai培训
Omigeq29 分钟前
1.2.2 - 采样搜索算法(以RRT和RRT*为例) - Python运动规划库教程(Python Motion Planning)
开发语言·人工智能·python·机器人
mantch34 分钟前
教程:Nano-Banana Pro,谷歌官方指南
人工智能·aigc
机器之心1 小时前
又快又省?仅5%参数、训练快4倍!ArcFlow用「非线性」魔法实现FLUX/Qwen推理40倍加速
人工智能·openai
机器之心1 小时前
DeepMind:智能体越多越乱,Agent天花板出现了?
人工智能·openai
banmajiyu1 小时前
异或问题(XOR Question):从单层感知机到多层感知机
人工智能