激活函数总结(三十五):激活函数补充(KAF、Siren)

激活函数总结(三十五):激活函数补充

  • [1 引言](#1 引言)
  • [2 激活函数](#2 激活函数)
    • [2.1 KAF激活函数](#2.1 KAF激活函数)
    • [2.2 Siren激活函数](#2.2 Siren激活函数)
  • [3. 总结](#3. 总结)

1 引言

前面的文章中已经介绍了介绍了一系列激活函数 (SigmoidTanhReLULeaky ReLUPReLUSwishELUSELUGELUSoftmaxSoftplusMishMaxoutHardSigmoidHardTanhHardswishHardShrinkSoftShrinkTanhShrinkRReLUCELUReLU6GLUSwiGLUGTUBilinearReGLUGEGLUSoftminSoftmax2dLogsoftmaxIdentityLogSigmoidBent IdentityAbsoluteBipolarBipolar SigmoidSinusoidCosineArcsinhArccoshArctanhLeCun TanhTanhExpGaussianGCUASUSQUNCUDSUSSUSReLUBReLUPELUPhishRBFSQ-RBFISRUISRLUSQNLPLUAPLInverse CubicSoft ExponentialParametricLinearPiecewise Linear UnitCLLSquaredReLUModReLUCosReLUSinReLUProbitSmishMultiquadraticInvMultiquadraticPSmishESwishCoLUShiftedSoftPlusLogitSoftsignELiSHHard ELiSHSerfFReLUQReLUm-QReLUFReLUCReLU)。在这篇文章中,会接着上文提到的众多激活函数继续进行介绍,给大家带来更多不常见的激活函数的介绍。这里放一张激活函数的机理图:

2 激活函数

2.1 KAF激活函数

论文链接:Kafnets: kernel-based non-parametric activation functions for neural networks

KAF(Kernel Activation Function)旨在通过引入核函数的概念来提高神经网络的性能。KAF 激活函数的主要思想是将输入通过核函数进行映射,然后再应用标准的激活函数,从而实现更高维度非线性变换。这可以帮助神经网络更好地建模非线性关系。其数学表达式和数学图像分别如下所示:
f ( s ) = ∑ i = 1 D α i κ ( s , d i ) f(s) = \sum_{i=1}^D \alpha_i \kappa( s, d_i) f(s)=i=1∑Dαiκ(s,di)

其中, 内核元素的字典 d 0 , ... , d D d_0, \ldots, d_D d0,...,dD 通过采样修复 x x x 轴,在 0 附近具有均匀的步长; 用户选择内核函数(例如,高斯ReLUSoftplus)和内核元素的数量 D D D 作为超参数。更大的字典导致更具表现力的激活函数和更多可训练参数; 线性系数通过标准反向传播在每个神经元上独立调整。

优点:

  • 非线性建模 : KAF 允许神经网络进行非线性映射,有助于更好地捕获数据中的复杂模式和关系。
  • 核方法 : 引入核函数的思想可以使神经网络具备核方法的一些优点,如处理高维数据学习复杂的非线性函数。

缺点:

  • 计算成本 : 使用核函数意味着需要计算输入的非线性映射,这可能会增加计算成本,尤其是在大规模数据和深层网络中。
  • 超参数调整 : 选择适当的核函数以及核函数的超参数可能需要一些经验调整
  • 解释性 : KAF 引入了更复杂非线性映射,可能会降低模型的解释性

在某些特殊情况下可能有所应用,尤其是使用核函数时,一般不使用。。。。

2.2 Siren激活函数

论文链接:Implicit Neural Representations with Periodic Activation Functions

Siren(Sinusoidal Representation Network)是隐式神经表示周期性激活函数。具体来说,它使用正弦作为周期性激活函数。其数学表达式和数学图像分别如下所示:
Φ ( x ) = W n ( ϕ n − 1 ∘ ϕ n − 2 ∘ ⋯ ∘ ϕ 0 ) ( x ) + b n ϕ i ( x i ) = s i n ( W i x i + b i ) \Phi\left(x\right) = \textbf{W}{n}\left(\phi{n-1} \circ \phi_{n-2} \circ \dots \circ \phi_{0} \right)(x)+b_n \\ \phi_{i}(x_i)= sin(W_ix_i+b_i) Φ(x)=Wn(ϕn−1∘ϕn−2∘⋯∘ϕ0)(x)+bnϕi(xi)=sin(Wixi+bi)

优点:

  • 平滑性 : 正弦函数是一个平滑的函数,可以提供平滑的非线性变换,有助于避免梯度消失问题。
  • 表示能力 : Siren 激活函数具有强大的表示能力,能够适应多种数据模式,包括高频信号和图像中的细节。
  • 可扩展性 : Siren 可以用于处理不同尺度分辨率的数据,因此在图像生成处理方面表现出色。

缺点:

  • 计算成本 : 由于正弦函数涉及三角函数的计算,相对于某些简单的激活函数,Siren 可能具有较高的计算成本。
  • 超参数调整 : 对于正弦函数的参数(如频率)需要进行调整,这可能需要一些经验和实验。
  • 解释性 : 正弦函数不像某些其他激活函数那样具有直观物理解释,这可能会降低模型的解释性。

Siren 激活函数通常用于生成模型超分辨率任务和其他需要捕捉高频信息的任务中。

3. 总结

到此,使用 激活函数总结(三十五) 已经介绍完毕了!!! 如果有什么疑问欢迎在评论区提出,对于共性问题可能会后续添加到文章介绍中。如果存在没有提及的激活函数也可以在评论区提出,后续会对其进行添加!!!!

如果觉得这篇文章对你有用,记得点赞、收藏并分享给你的小伙伴们哦😄。

相关推荐
流烟默几秒前
基于Optuna 贝叶斯优化的自动化XGBoost 超参数调优器
人工智能·python·机器学习·超参数优化
海琴烟Sunshine3 分钟前
leetcode 263. 丑数 python
python·算法·leetcode
AI视觉网奇21 分钟前
yolo 获取异常样本 yolo 异常
开发语言·python·yolo
程序员爱钓鱼28 分钟前
Python编程实战 面向对象与进阶语法 迭代器与生成器
后端·python·ipython
程序员爱钓鱼37 分钟前
Python编程实战 面向对象与进阶语法 JSON数据读写
后端·python·ipython
TH88861 小时前
一体化负氧离子监测站:实时、精准监测空气中负氧离子浓度及其他环境参数
python
苏打水com1 小时前
0基础学前端:100天拿offer实战课(第3天)—— CSS基础美化:给网页“精装修”的5大核心技巧
人工智能·python·tensorflow
摘星观月2 小时前
【深度学习5】多层感知机
人工智能·深度学习
顾安r2 小时前
11.5 脚本 本地网站收藏(解封归来)
linux·服务器·c语言·python·bash
Blossom.1182 小时前
把AI“贴”进路灯柱:1KB决策树让老旧路灯自己报「灯头松动」
java·人工智能·python·深度学习·算法·决策树·机器学习