技术栈
深度学习系统
victory0431
4 小时前
缓存
·
自动微分
·
深度学习系统
梯度计算 反向传播会不会缓存loss的求导公式
PyTorch 不会缓存“符号级的求导公式” 但它会在 forward 时动态构建计算图, 在 backward 时高效复用“局部梯度规则”
我是有底线的