深度学习中的梯度相关问题

終不似少年遊*2025-02-09 22:43

1.求偏导的意义、作用？为什么要求偏导？

偏导数帮助我们理解函数在某一个变量变化时，函数值如何变化，同时保持其他变量不变。在机器学习中，尤其是训练神经网络时，我们通过求偏导数来确定如何调整模型参数以最小化损失函数。这相当于找到损失景观中每个参数的斜率，指导我们如何调整参数以更快地达到最小损失。这对于像梯度下降这样的优化算法至关重要。

2.加法门、乘法门、激活函数门是什么？

这些是计算图中的操作：

3.常见的损失函数框架都会封装好，反向传播求导先从损失函数开始？

在TensorFlow或PyTorch等框架中，反向传播从损失函数开始。框架自动计算从损失到各权重的梯度，极大简化了开发过程。

回归问题：

4.MSE：求导损失函数后，其实是求了每条样本残差的平均值？

对于均方误差（MSE），损失函数的导数相对于预测值，实际上是每条样本残差（预测值与真实值之差）的平均值。这符合MSE是 squared differences的平均值，其导数直接与残差相关。

分类问题：

5.对于MSE和交叉熵损失函数，求导（偏导）后得到的结果一样，是否意味着对于回归和分类两大类问题，除了输入的数据X的类型不一样（回归--连续型；分类--离散型），在做反向传播时的计算结构大体相近？

只能说梯度的公式一样，但是数据的类型和计算图中的网络结构、超参数什么的不太近似，如果很接近就没有对问题的区分度了