深度学习记录--正则化(regularization)

什么是正则化？

正则化(regularization)是一种实用的减少方差 (variance )的方法，也即避免过度拟合

几种正则化的方法

L2正则化

又被称为权重衰减(weight dacay)

在成本函数中加上正则项：

其中

由于在w的更新过程中会递减，即权重衰减

w递减的过程，实际上是w趋近于0的过程

在这个过程中，部分单元的影响逐渐减小(可以近似看作隐藏 )，最终成为深层神经网络(类似线性回归)，从最开始的右图逐渐变为左图，即从high variance --> high bias

在变化的中间存在一个just right的状态，这个状态则是最优情况

缺点：

为了搜索合适的正则化参数lambda，需要进行大量验证计算，花费时间很长

dropout(随机失活)

dropout基本原理：将神经网络中的部分单元进行随机删除/失活 (将它们的影响降至几乎不存在)，让原本的神经网络样本训练规模变小

常用方法：inverted dropout(反向随机失活)

设置一个概率参数keep_prob，在例子中设置为0.8，表示有0.2的概率让单元失活

设置bool矩阵d3，将a3矩阵与d3矩阵进行矩阵乘法 运算，然后a3/=keep_prob，保持未被失活单元的数据的完整性

代码实现：

python 复制代码

import numpy as np
a3=np.random.rand(3,3)
print("before dropout : \n",a3)
keep_prob=0.8
# print(a3.shape[0],a3.shape[1])
d3=np.random.rand(a3.shape[0],a3.shape[1])<keep_prob
# print("d3 = ",d3)
a3=np.multiply(a3,d3)
a3/=keep_prob
print("after dropout : \n",a3)

运行结果：