jax可微分编程的笔记（2）

王伟19822024-02-24 8:55

jax可微分编程的笔记（2）

第2章自动微分

自动微分和符号求导有诸多的相似之处：它们同样依赖于计算图

的构建，同样依赖于求导的递归实现。从某种意义上来说，它们

甚至有完全相同的数据结构。不过，二者的区别也是显著的：

符号微分侧重于符号，而自动微分则侧重于数值。

自动微分是一种专门化的计算图网络。各种所谓的"神经网络"，

只不过是某种特殊的计算图结构，而由此引申出所谓的"深度学习"

的概念，不过是可微分编程框架的这一概念外延的子集。

2.1.1 前向模式的理论

自动微分的前向模式适用于函数输入参数个数较少，输出参数个数

较多的场合。

2.1.2 前向模式的二元数诠释

从数学的角度来看，我们可以将自动微分的前向模式理解为将函数

延拓到二元数域的结果。

从本质上来说，二元数幂零元E^2=0，承接了同调论中的重要结论

d。df=0 ，在这样的视角下，二元数与微分操作在数学结构上的相似

就成为了显然。

2.2 反向模式

直观上来看，反向模式的算法与前向模式相比显得极为不同，然而，

自动微分的反向模式与前向模式，其实具有相当的一致性。

2.2.1 反向模式的理论

对结点的处理将会沿着计算图构建顺序的相反方向执行，这样的求导

实现方式，称为自动微分的反向模式，由此引出的算法又称为反向

传播算法。

第一次反向传播，我们可以计算出雅可比矩阵的一行，因此,自动微分

的反向模式适用于函数的输入变量较多，而输出维数较少的场合。

在反向模式的代码现实中,要对计算图网络进行拓扑排序,用于拓扑排序

的卡恩算法是卡恩在1962年提出的.它允许我们尝试对任意的有向图

进行拓扑排序

2.2.2 反向模式与前向模式的统一

在前向模式时，如果将计算图所定义的函数f扩展到二元数域，其切值

中将包含着雅可比矩阵作用于x的结果。

当一个函数的输入x发生了变化时，函数的输出f将如何变化？在前向

模式中，在保留到一阶的情形下，x的微小变化 delta x 将会导致输出

的f产生变化 delta f.这样的响应关系将会随着正向的计算，穿过一

整张由函数f所定义的计算图，这样的数学行为被我们用二元数的运算

法则进行了严格的描述。

下面我们希望询问上述问题的反问题：当一个函数的输出f发生了变化

时，函数的输入x将如何变化？在一个机械臂的控制问题中，自动微分

的前向模式相当于根据每个机械节点的形态及转速，控制机械臂末端

的状态；而自动微分的反向模式，则是通过机械臂终端节点的空间状态

及运动趋势，控制其每个关节的运动参数。

对于一个函数数值的计算，只有在它所有的输入的值全部完成计算后

才能进行计算，这样的计算顺序其实就是一种拓扑序。

上一篇：使用C#+NPOI进行Excel处理，实现多个Excel文件的求和统计

下一篇：飞行机器人专栏（十三）-- 智能优化算法之粒子群优化算法与多目标优化

热门推荐

01GitHub 镜像站点 02【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 03OpenClaw 使用和管理 MCP 完全指南 04OpenClaw + 飞书（Feishu）环境搭建指南 05OpenClaw优化飞书API 额度已耗尽问题 06Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 07Window 10部署openclaw报错node.exe : npm error code 128 08Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 09OpenClaw 接入阿里云百炼 Coding Plan 指南 10本地部署 OpenClaw + DeepSeek-R1 完全指南