深度学习记录--梯度检验

数值逼近

为了对梯度进行检验,需要计算近似误差值来接近梯度

对于单边误差和双边误差公式,其中双边误差与真实梯度相差更小,故一般采用双边误差公式

双边误差

公式:

梯度检验(gradient checking)

对于成本函数,求出的导数,计算出双边误差,再将两者进行比较
比较方法:

,判断的大小

,则误差很小,效果很好

,则误差一般,效果一般

,则误差较大,需要考虑是否错误较多

梯度检验的注意事项

不要在训练中使用梯度检验,它只适用于调试

梯度检验的计算时间较长,且通常在backprop后向传播中进行
当梯度检验得出偏差过大时,要对所有参数进行检查
使用正则化时,要记住在梯度检验中保留正则项
不要在梯度检验的过程中使用dropout

在每次迭代过程中,dropout会随机消除隐层单元的不同子集,J函数难以明确计算

相关推荐
说私域8 分钟前
社群时代下的商业变革:“开源AI智能名片链动2+1模式S2B2C商城小程序”的应用与影响
人工智能·小程序·开源
格林威42 分钟前
AOI在风电行业制造领域中的应用
人工智能·数码相机·计算机视觉·视觉检测·制造·机器视觉·aoi
大千AI助手42 分钟前
Graph-R1:智能图谱检索增强的结构化多轮推理框架
人工智能·神经网络·大模型·rag·检索增强生成·大千ai助手·graph-r1
瑞禧生物ruixibio1 小时前
ABA-Biotin,脱落酸-生物素,用于追踪ABA在植物细胞中的分布及运输路径
人工智能
哔哩哔哩技术1 小时前
B站基础安全在AI溯源方向的探索实践
人工智能
IT_陈寒1 小时前
7个鲜为人知的JavaScript性能优化技巧,让你的网页加载速度提升50%
前端·人工智能·后端
城数派2 小时前
1951-2100年全球复合极端气候事件数据集
人工智能·数据分析
菜鸟‍2 小时前
【论文学习】基于 Transformer 的图像分割模型
深度学习·学习·transformer
Hody912 小时前
【XR硬件系列】夸克 AI 眼镜预售背后:阿里用 “硬件尖刀 + 生态护城河“ 重构智能穿戴逻辑
人工智能·重构
Icoolkj2 小时前
RAGFlow与Dify知识库:对比选型与技术落地解析
人工智能