深度学习记录--梯度检验

数值逼近

为了对梯度进行检验,需要计算近似误差值来接近梯度

对于单边误差和双边误差公式,其中双边误差与真实梯度相差更小,故一般采用双边误差公式

双边误差

公式:

梯度检验(gradient checking)

对于成本函数,求出的导数,计算出双边误差,再将两者进行比较
比较方法:

,判断的大小

,则误差很小,效果很好

,则误差一般,效果一般

,则误差较大,需要考虑是否错误较多

梯度检验的注意事项

不要在训练中使用梯度检验,它只适用于调试

梯度检验的计算时间较长,且通常在backprop后向传播中进行
当梯度检验得出偏差过大时,要对所有参数进行检查
使用正则化时,要记住在梯度检验中保留正则项
不要在梯度检验的过程中使用dropout

在每次迭代过程中,dropout会随机消除隐层单元的不同子集,J函数难以明确计算

相关推荐
风象南4 小时前
我把大脑开源给了AI
人工智能·后端
Johny_Zhao6 小时前
OpenClaw安装部署教程
linux·人工智能·ai·云计算·系统运维·openclaw
飞哥数智坊6 小时前
我帮你读《一人公司(OPC)发展研究》
人工智能
冬奇Lab10 小时前
OpenClaw 源码精读(3):Agent 执行引擎——AI 如何「思考」并与真实世界交互?
人工智能·aigc
没事勤琢磨11 小时前
如何让 OpenClaw 控制使用浏览器:让 AI 像真人一样操控你的浏览器
人工智能
用户51914958484511 小时前
CrushFTP 认证绕过漏洞利用工具 (CVE-2024-4040)
人工智能·aigc
牛马摆渡人52812 小时前
OpenClaw实战--Day1: 本地化
人工智能
前端小豆12 小时前
玩转 OpenClaw:打造你的私有 AI 助手网关
人工智能
BugShare12 小时前
写一个你自己的Agent Skills
人工智能·程序员
机器之心12 小时前
英伟达护城河被AI攻破,字节清华CUDA Agent,让人人能搓CUDA内核
人工智能·openai