深度学习记录--梯度检验

数值逼近

为了对梯度进行检验,需要计算近似误差值来接近梯度

对于单边误差和双边误差公式,其中双边误差与真实梯度相差更小,故一般采用双边误差公式

双边误差

公式:

梯度检验(gradient checking)

对于成本函数,求出的导数,计算出双边误差,再将两者进行比较
比较方法:

,判断的大小

,则误差很小,效果很好

,则误差一般,效果一般

,则误差较大,需要考虑是否错误较多

梯度检验的注意事项

不要在训练中使用梯度检验,它只适用于调试

梯度检验的计算时间较长,且通常在backprop后向传播中进行
当梯度检验得出偏差过大时,要对所有参数进行检查
使用正则化时,要记住在梯度检验中保留正则项
不要在梯度检验的过程中使用dropout

在每次迭代过程中,dropout会随机消除隐层单元的不同子集,J函数难以明确计算

相关推荐
yangshuo12817 分钟前
风车OVF镜像:解放AI开发限制的Ubuntu精简系统
linux·人工智能·ubuntu
Jamence12 分钟前
多模态大语言模型arxiv论文略读(七十七)
人工智能·语言模型·自然语言处理
AI量化投资实验室1 小时前
金融量化智能体,如何开发一个有效的策略?
人工智能·金融
九章云极AladdinEdu1 小时前
GPU SIMT架构的极限压榨:PTX汇编指令级并行优化实践
汇编·人工智能·pytorch·python·深度学习·架构·gpu算力
数智大号1 小时前
浪潮云边协同:赋能云计算变革的强力引擎
人工智能
胡玉洋2 小时前
从新手到高手:全面解析 AI 时代的「魔法咒语」——Prompt
人工智能·ai·prompt·transformer·协议
是店小二呀2 小时前
Trae 插件 Builder 模式:从 0 到 1 开发天气查询小程序,解锁 AI 编程新体验
人工智能·ai编程·trae
kyle~2 小时前
深度学习框架---TensorFlow概览
人工智能·深度学习·tensorflow
CodeJourney.2 小时前
ChemBlender:科研绘图创新解决方案
数据库·人工智能·信息可视化·excel
电鱼智能的电小鱼2 小时前
产线视觉检测设备技术方案:基于EFISH-SCB-RK3588/SAIL-RK3588的国产化替代赛扬N100/N150全场景技术解析
linux·人工智能·嵌入式硬件·计算机视觉·视觉检测·实时音视频