深度学习中常见的激活函数

1. Sigmoid函数

  • 范围:输出值在0到1之间。
  • 导数
  • 优点:简单直观,适用于二分类问题的输出层。
  • 缺点:在输入值较大或较小时,梯度会变得非常小(梯度消失),这会导致深层网络训练困难。同时,Sigmoid函数的输出不是以0为中心的,这可能会导致梯度下降过程中的不稳定。

应用场景:常用于二分类问题的输出层,早期的全连接层中也会使用。

2. Tanh(双曲正切函数)

  • 范围:输出值在-1到1之间。
  • 导数
  • 优点:相比Sigmoid,tanh函数的输出以0为中心,这有助于梯度的传播。对于输入值较小或较大的情况,梯度的消失问题相对较轻。
  • 缺点:当输入值非常大或非常小时,tanh函数的梯度仍然会接近于零(梯度消失)。

应用场景:适用于中间层的激活函数,尤其是在需要负值和正值的情况中。

3. ReLU()激活函数

  • 范围:输出值在0到正无穷之间。
  • 导数
  • 优点:计算简单,梯度计算效率高,减少了梯度消失的问题,有助于加速网络的收敛。
  • 缺点:可能导致"死亡神经元"问题,即大量神经元输出恒为0,无法进行有效的训练。

应用场景:广泛应用于隐藏层的激活函数,是现代深度学习模型中的默认选择。

相关推荐
Yeats_Liao几秒前
CANN Samples(七):视频与流媒体:RTSP与多路输入实战
人工智能·机器学习·音视频
玖日大大6 分钟前
X-AnyLabeling-实践使用AI驱动的图像
人工智能
倔强的石头10615 分钟前
Rokid AI眼镜:连接现实与数字的桥梁,探索下一代智能应用开发
人工智能·ai·ar·rokid·ai眼镜
java1234_小锋15 分钟前
基于Python深度学习的车辆车牌识别系统(PyTorch2卷积神经网络CNN+OpenCV4实现)视频教程 - 集成到web系统-识别历史记录实现
python·深度学习·cnn·车牌识别
雪不下18 分钟前
医用IT技术:CT(3.1)
图像处理·人工智能
咚咚王者19 分钟前
人工智能之数据分析 Matplotlib:第一章 简介和安装
人工智能·数据分析·matplotlib
极客BIM工作室22 分钟前
AI论文整理:Flamingo: a Visual Language Model for Few-Shot Learning
人工智能·语言模型·自然语言处理
wumingxiaoyao22 分钟前
AI - AI Agent 是什么?为什么最近这么火?
人工智能·ai·chatgpt·ai agent
模型优化师22 分钟前
【必收藏】AI大模型面试精选20题:从基础到高级,轻松应对大模型岗位面试
人工智能·面试·职场和发展·ai大模型·大模型学习·大模型入门·大模型教程
白日做梦Q27 分钟前
深度学习调参手册:学习率、Batch Size 的最优搭配策略
深度学习·学习·batch