神经网络基础-神经网络补充概念-52-正则化网络的激活函数

丰。。2023-08-20 13:01

概念

正则化是一种用于减少过拟合（overfitting）的技术，可以在神经网络的各个层次中应用，包括激活函数。激活函数的正则化主要目的是减少神经网络的复杂度，防止网络在训练集上过度学习，从而提高泛化能力。

L2 正则化（权重衰减）：在网络的损失函数中引入 L2 正则化项，通过惩罚权重的平方和来防止权重过大。L2 正则化可以使权重趋向于分布在较小的范围内，有助于减少模型的复杂性。

Dropout：虽然不是激活函数本身的正则化，但是 Dropout 是一种在训练过程中随机将一些神经元置零的技术，可以看作是对网络的激活函数进行正则化。Dropout 可以防止神经元之间的协同适应，减少过拟合。

激活函数的变种：一些激活函数的变种具有正则化的效果，例如 Leaky ReLU、Parametric ReLU（PReLU）、Exponential Linear Units（ELU）等。这些激活函数在负值区域引入一些非线性，可以有助于减少神经元的活性，从而起到正则化的作用。

Noise Injection：在激活函数的输入中添加噪声可以帮助模型更好地泛化。例如，可以在输入数据中添加随机噪声，或者在激活函数的输出中添加高斯噪声。

Batch Normalization：尽管 Batch Normalization 主要用于加速训练和稳定网络，但它也可以起到正则化的作用。通过规范化每个批次的输入，Batch Normalization 可以减少神经元的协同适应，从而有助于防止过拟合。