Tensorflow常见激活函数 -- Tensorflow自学笔记10

激活函数 激活函数是用来加入非线性因素的,因为线性模型的表达能力不够。引入非线性激活函数,可使深层神经网络的表达能力更加强大。

一. 什么是优秀的激活函数?

优秀的激活函数应满足:

  1. 非线性:

激活函数非线性时,多层神经网络可逼近所有函数

  1. 可微性

优化器大多用梯度下降更新参数

  1. 单调性

当激活函数是单调的,能保证单层网络的损失函数是凸函数

  1. 近似恒等性

f(x)约等于x. 当参数初始化为随机小值时,神经网络更稳定

  1. 激活函数输出值的范围:
  1. 激活函数输出为有限值时,基于梯度的优化方法更稳定

  2. 激活函数输出为无限值时,建议调小学习率

二. 常见的激活函数

复制代码
常见的激活函数有

3.1 sigmoid

TensorFlow API: tf.math.sigmoid

优点:

  1. 输出映射在(0,1)之间,单调连续,输出范围有限,优化稳定,可用作输出层;

  2. 求导容易。

缺点:

  1. 易造成梯度消失;

  2. 输出非0均值,收敛慢;

  3. 幂运算复杂,训练时间长。

sigmoid函数可应用在训练过程中。然而,当处理分类问题作出输出时,sigmoid却无能为力。简 单地说,sigmoid函数只能处理两个类,不适用于多分类问题。而softmax可以有效解决这个问题,并 且softmax函数大都运用在神经网路中的最后一层网络中,使得值得区间在(0,1)之间,而不是二分类 的。

3.2 tanh

TensorFlow API: tf.math.tanh

优点:

  1. 比sigmoid函数收敛速度更快。

  2. 相比sigmoid函数,其输出以0为中心。

缺点

  1. 易造成梯度消失;

  2. 幂运算复杂,训练时间长。

3.3 ReLU

TensorFlow API: tf.nn.relu

优点

  1. 解决了梯度消失问题(在正区间);

  2. 只需判断输入是否大于0,计算速度快;

  3. 收敛速度远快于sigmoid和tanh,因为sigmoid和tanh涉及很多expensive的操作;

  4. 提供了神经网络的稀疏表达能力。

缺点:

  1. 输出非0均值,收敛慢;

  2. Dead ReLU问题:某些神经元可能永远不会被激活,导致相应的参数永远不能被更新。

3.4 Leaky ReLU

TensorFlow API: tf.nn.leaky_relu

理论上来讲,Leaky ReLU有ReLU的所有优点,外加不会有Dead ReLU问题,但是在实际操作当

中,并没有完全证明Leaky ReLU总是好于ReLU。

3.5 softmax

TensorFlow API: tf.nn.softmax

对神经网络全连接层输出进行变换,使其服从概率分布,即每个值都位于[0,1]区间且和为1。

3.6 建议

对初学者的的建议:

  1. 首选ReLU激活函数;

  2. 学习率设置较小值;

  3. 输入特征标准化,即让输入特征满足以0为均值,1为标准差的正态分布;

  4. 初始化问题:初始参数中心化,即让随机生成的参数满足以0为均值, 为标准差的正态分布。

相关推荐
大闲在人1 分钟前
10. 配送中心卡车卸货流程分析:产能利用率与利特尔法则的实践应用
人工智能·供应链管理·智能制造·工业工程
woshikejiaih1 分钟前
**播客听书与有声书区别解析2026指南,适配不同场景的音频
大数据·人工智能·python·音视频
qq7422349844 分钟前
APS系统与OR-Tools完全指南:智能排产与优化算法实战解析
人工智能·算法·工业·aps·排程
兜兜转转了多少年5 分钟前
从脚本到系统:2026 年 AI 代理驱动的 Shell 自动化
运维·人工智能·自动化
深蓝海拓9 分钟前
PySide6,QCoreApplication::aboutToQuit与QtQore.qAddPostRoutine:退出前后的清理工作
笔记·python·qt·学习·pyqt
LLWZAI9 分钟前
十分钟解决朱雀ai检测,AI率为0%
人工智能
无忧智库9 分钟前
某市“十五五“智慧气象防灾减灾精准预报系统建设方案深度解读 | 从“看天吃饭“到“知天而作“的数字化转型之路(WORD)
大数据·人工智能
方见华Richard9 分钟前
方见华个人履历|中英双语版
人工智能·经验分享·交互·原型模式·空间计算
凤希AI伴侣10 分钟前
凤希AI伴侣:一人成军的工具哲学与全模态内容实践-2026年2月7日
人工智能·凤希ai伴侣
Sagittarius_A*11 分钟前
特征检测:SIFT 与 SURF(尺度不变 / 加速稳健特征)【计算机视觉】
图像处理·人工智能·python·opencv·计算机视觉·surf·sift