技术栈

深度学习系统

victory0431
4 小时前
缓存·自动微分·深度学习系统
梯度计算 反向传播会不会缓存loss的求导公式PyTorch 不会缓存“符号级的求导公式” 但它会在 forward 时动态构建计算图, 在 backward 时高效复用“局部梯度规则”
我是有底线的