Tensorflow常见激活函数 -- Tensorflow自学笔记10

激活函数激活函数是用来加入非线性因素的，因为线性模型的表达能力不够。引入非线性激活函数，可使深层神经网络的表达能力更加强大。

一. 什么是优秀的激活函数？

优秀的激活函数应满足:

非线性:

激活函数非线性时，多层神经网络可逼近所有函数

可微性

优化器大多用梯度下降更新参数

单调性

当激活函数是单调的，能保证单层网络的损失函数是凸函数

近似恒等性

f(x)约等于x. 当参数初始化为随机小值时，神经网络更稳定

激活函数输出值的范围:

激活函数输出为有限值时，基于梯度的优化方法更稳定
激活函数输出为无限值时，建议调小学习率

二. 常见的激活函数

复制代码

常见的激活函数有

3.1 sigmoid

TensorFlow API: tf.math.sigmoid

优点:

输出映射在(0,1)之间，单调连续，输出范围有限，优化稳定，可用作输出层;
求导容易。

缺点:

易造成梯度消失;
输出非0均值，收敛慢;
幂运算复杂，训练时间长。

sigmoid函数可应用在训练过程中。然而，当处理分类问题作出输出时，sigmoid却无能为力。简单地说，sigmoid函数只能处理两个类，不适用于多分类问题。而softmax可以有效解决这个问题，并且softmax函数大都运用在神经网路中的最后一层网络中，使得值得区间在(0,1)之间，而不是二分类的。