激活函数总结(三十五):激活函数补充(KAF、Siren)

激活函数总结(三十五):激活函数补充

  • [1 引言](#1 引言)
  • [2 激活函数](#2 激活函数)
    • [2.1 KAF激活函数](#2.1 KAF激活函数)
    • [2.2 Siren激活函数](#2.2 Siren激活函数)
  • [3. 总结](#3. 总结)

1 引言

前面的文章中已经介绍了介绍了一系列激活函数 (SigmoidTanhReLULeaky ReLUPReLUSwishELUSELUGELUSoftmaxSoftplusMishMaxoutHardSigmoidHardTanhHardswishHardShrinkSoftShrinkTanhShrinkRReLUCELUReLU6GLUSwiGLUGTUBilinearReGLUGEGLUSoftminSoftmax2dLogsoftmaxIdentityLogSigmoidBent IdentityAbsoluteBipolarBipolar SigmoidSinusoidCosineArcsinhArccoshArctanhLeCun TanhTanhExpGaussianGCUASUSQUNCUDSUSSUSReLUBReLUPELUPhishRBFSQ-RBFISRUISRLUSQNLPLUAPLInverse CubicSoft ExponentialParametricLinearPiecewise Linear UnitCLLSquaredReLUModReLUCosReLUSinReLUProbitSmishMultiquadraticInvMultiquadraticPSmishESwishCoLUShiftedSoftPlusLogitSoftsignELiSHHard ELiSHSerfFReLUQReLUm-QReLUFReLUCReLU)。在这篇文章中,会接着上文提到的众多激活函数继续进行介绍,给大家带来更多不常见的激活函数的介绍。这里放一张激活函数的机理图:

2 激活函数

2.1 KAF激活函数

论文链接:Kafnets: kernel-based non-parametric activation functions for neural networks

KAF(Kernel Activation Function)旨在通过引入核函数的概念来提高神经网络的性能。KAF 激活函数的主要思想是将输入通过核函数进行映射,然后再应用标准的激活函数,从而实现更高维度非线性变换。这可以帮助神经网络更好地建模非线性关系。其数学表达式和数学图像分别如下所示:
f ( s ) = ∑ i = 1 D α i κ ( s , d i ) f(s) = \sum_{i=1}^D \alpha_i \kappa( s, d_i) f(s)=i=1∑Dαiκ(s,di)

其中, 内核元素的字典 d 0 , ... , d D d_0, \ldots, d_D d0,...,dD 通过采样修复 x x x 轴,在 0 附近具有均匀的步长; 用户选择内核函数(例如,高斯ReLUSoftplus)和内核元素的数量 D D D 作为超参数。更大的字典导致更具表现力的激活函数和更多可训练参数; 线性系数通过标准反向传播在每个神经元上独立调整。

优点:

  • 非线性建模 : KAF 允许神经网络进行非线性映射,有助于更好地捕获数据中的复杂模式和关系。
  • 核方法 : 引入核函数的思想可以使神经网络具备核方法的一些优点,如处理高维数据学习复杂的非线性函数。

缺点:

  • 计算成本 : 使用核函数意味着需要计算输入的非线性映射,这可能会增加计算成本,尤其是在大规模数据和深层网络中。
  • 超参数调整 : 选择适当的核函数以及核函数的超参数可能需要一些经验调整
  • 解释性 : KAF 引入了更复杂非线性映射,可能会降低模型的解释性

在某些特殊情况下可能有所应用,尤其是使用核函数时,一般不使用。。。。

2.2 Siren激活函数

论文链接:Implicit Neural Representations with Periodic Activation Functions

Siren(Sinusoidal Representation Network)是隐式神经表示周期性激活函数。具体来说,它使用正弦作为周期性激活函数。其数学表达式和数学图像分别如下所示:
Φ ( x ) = W n ( ϕ n − 1 ∘ ϕ n − 2 ∘ ⋯ ∘ ϕ 0 ) ( x ) + b n ϕ i ( x i ) = s i n ( W i x i + b i ) \Phi\left(x\right) = \textbf{W}{n}\left(\phi{n-1} \circ \phi_{n-2} \circ \dots \circ \phi_{0} \right)(x)+b_n \\ \phi_{i}(x_i)= sin(W_ix_i+b_i) Φ(x)=Wn(ϕn−1∘ϕn−2∘⋯∘ϕ0)(x)+bnϕi(xi)=sin(Wixi+bi)

优点:

  • 平滑性 : 正弦函数是一个平滑的函数,可以提供平滑的非线性变换,有助于避免梯度消失问题。
  • 表示能力 : Siren 激活函数具有强大的表示能力,能够适应多种数据模式,包括高频信号和图像中的细节。
  • 可扩展性 : Siren 可以用于处理不同尺度分辨率的数据,因此在图像生成处理方面表现出色。

缺点:

  • 计算成本 : 由于正弦函数涉及三角函数的计算,相对于某些简单的激活函数,Siren 可能具有较高的计算成本。
  • 超参数调整 : 对于正弦函数的参数(如频率)需要进行调整,这可能需要一些经验和实验。
  • 解释性 : 正弦函数不像某些其他激活函数那样具有直观物理解释,这可能会降低模型的解释性。

Siren 激活函数通常用于生成模型超分辨率任务和其他需要捕捉高频信息的任务中。

3. 总结

到此,使用 激活函数总结(三十五) 已经介绍完毕了!!! 如果有什么疑问欢迎在评论区提出,对于共性问题可能会后续添加到文章介绍中。如果存在没有提及的激活函数也可以在评论区提出,后续会对其进行添加!!!!

如果觉得这篇文章对你有用,记得点赞、收藏并分享给你的小伙伴们哦😄。

相关推荐
FreedomLeo13 分钟前
Python数据分析NumPy和pandas(四十、Python 中的建模库statsmodels 和 scikit-learn)
python·机器学习·数据分析·scikit-learn·statsmodels·numpy和pandas
风间琉璃""24 分钟前
二进制与网络安全的关系
安全·机器学习·网络安全·逆向·二进制
007php00731 分钟前
GoZero 上传文件File到阿里云 OSS 报错及优化方案
服务器·开发语言·数据库·python·阿里云·架构·golang
Tech Synapse33 分钟前
Python网络爬虫实践案例:爬取猫眼电影Top100
开发语言·爬虫·python
一行玩python1 小时前
SQLAlchemy,ORM的Python标杆!
开发语言·数据库·python·oracle
Java Fans1 小时前
梯度提升树(Gradient Boosting Trees)详解
机器学习·集成学习·boosting
数据小爬虫@2 小时前
利用Python爬虫获取淘宝店铺详情
开发语言·爬虫·python
谢眠2 小时前
机器学习day6-线性代数2-梯度下降
人工智能·机器学习
sp_fyf_20243 小时前
【大语言模型】ACL2024论文-19 SportsMetrics: 融合文本和数值数据以理解大型语言模型中的信息融合
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理
CoderIsArt3 小时前
基于 BP 神经网络整定的 PID 控制
人工智能·深度学习·神经网络