深度学习记录--梯度检验

数值逼近

为了对梯度进行检验,需要计算近似误差值来接近梯度

对于单边误差和双边误差公式,其中双边误差与真实梯度相差更小,故一般采用双边误差公式

双边误差

公式:

梯度检验(gradient checking)

对于成本函数,求出的导数,计算出双边误差,再将两者进行比较
比较方法:

,判断的大小

,则误差很小,效果很好

,则误差一般,效果一般

,则误差较大,需要考虑是否错误较多

梯度检验的注意事项

不要在训练中使用梯度检验,它只适用于调试

梯度检验的计算时间较长,且通常在backprop后向传播中进行
当梯度检验得出偏差过大时,要对所有参数进行检查
使用正则化时,要记住在梯度检验中保留正则项
不要在梯度检验的过程中使用dropout

在每次迭代过程中,dropout会随机消除隐层单元的不同子集,J函数难以明确计算

相关推荐
yiersansiwu123d6 小时前
AI伦理治理:在创新与规范之间寻找平衡之道
人工智能
程途拾光1586 小时前
AI 生成内容的伦理边界:深度伪造与信息真实性的保卫战
人工智能
趣味科技v6 小时前
亚马逊云科技储瑞松:AI智能体正在重塑未来工作模式
人工智能·科技
GEO AI搜索优化助手6 小时前
GEO生态重构:生成式引擎优化如何重塑信息传播链
人工智能·搜索引擎·生成式引擎优化·ai优化·geo搜索优化
爱笑的眼睛116 小时前
GraphQL:从数据查询到应用架构的范式演进
java·人工智能·python·ai
江上鹤.1486 小时前
Day40 复习日
人工智能·深度学习·机器学习
QYZL_AIGC6 小时前
全域众链以需求为基、政策为翼,创AI + 实体的可行之路
人工智能
火星资讯6 小时前
Zenlayer AI Gateway 登陆 Dify 市场,轻装上阵搭建 AI Agent
大数据·人工智能
TextIn智能文档云平台6 小时前
LLM处理非结构化文档有哪些痛点
人工智能·文档解析
行如流水7 小时前
BLIP和BLIP2解析
深度学习