深度学习记录--梯度检验

蹲家宅宅2024-01-21 22:10

数值逼近

为了对梯度进行检验，需要计算近似误差值来接近梯度

对于单边误差和双边误差公式，其中双边误差与真实梯度相差更小，故一般采用双边误差公式

双边误差

公式：

梯度检验(gradient checking)

对于成本函数，求出的导数，计算出双边误差，再将两者进行比较
比较方法：

，判断的大小

若，则误差很小，效果很好

若，则误差一般，效果一般

若，则误差较大，需要考虑是否错误较多

梯度检验的注意事项

不要在训练中使用梯度检验，它只适用于调试

梯度检验的计算时间较长，且通常在backprop后向传播中进行
当梯度检验得出偏差过大时，要对所有参数进行检查
使用正则化时，要记住在梯度检验中保留正则项
不要在梯度检验的过程中使用dropout

在每次迭代过程中，dropout会随机消除隐层单元的不同子集，J函数难以明确计算