神经网络——数据预处理

基于方差缩放的参数初始化

方差缩放方法能够根据神经元的链接数量来自适应地调整初始化分布地方差,尽可能的保证每个神经元的输入和输出方差一致。

那么,为什么要保证前后方差的一致性呢?

这是因为如果输入空间和输出空间的方差差别较大,也就是说数据空间分布差异较大,那么在反向传播时可能会引起梯度消失或爆炸问题。

比如,当输入空间稀疏,输出空间稠密时,将在输出空间计算得到的误差反向传播给输入空间时,这个误差可能会显得微不足道,从而引起梯度消失。而当输入空间稠密,输出空间稀疏时,将误差反向传播给输入空间,就可能会引起梯度爆炸,使得模型震荡。

参考:

深度学习基础入门篇[六]:模型调优,学习率设置(Warm Up、loss自适应衰减等),batch size调优技巧,基于方差放缩初始化方法。-腾讯云开发者社区-腾讯云 (tencent.com)

相关推荐
深圳信迈科技DSP+ARM+FPGA22 分钟前
基于全国产复旦微JFM7K325T+ARM人工智能数据处理平台
人工智能·复旦微jfm7k325t
m0_6896182825 分钟前
生物墨水:3D组织生物打印的基石
人工智能·笔记
锋.谢27 分钟前
深入研究深度学习
人工智能·深度学习
Papicatch1 小时前
【人工智能】-- 智能家居
图像处理·人工智能·python·人脸识别·智能家居
沽漓酒江1 小时前
机器学习第四十六周周报 FMP
人工智能·机器学习
yidaqiqi1 小时前
Anaconda+Pycharm两个软件从头到尾下载流程
ide·深度学习·pycharm
汀、人工智能1 小时前
AI Agent技术的最新进展与改变世界的典型项目巡礼
人工智能·agent
过于真实呢1 小时前
3-5 提高模型效果:归一化
人工智能·python·自然语言处理
Alice_JC2 小时前
《昇思25天学习打卡营第11天|计算机视觉-ResNet50迁移学习》
深度学习·学习·计算机视觉·迁移学习
The Open Group2 小时前
The Open Group 2024架构·AI标准峰会——合作伙伴+演讲嘉宾预热征集中!
人工智能·架构