C++builder中的人工智能（17）：神经网络中的自我规则非单调（Mish）激活函数

在这篇文章中，我们将探讨自我规则非单调激活函数------Mish在神经网络中的应用。了解Mish函数的工作原理，将有助于您在使用C++ IDE构建C++应用程序时更加得心应手。

神经网络中的激活函数是什么？

激活函数（phi()），也称为转移函数或阈值函数，它根据净输入函数 的给定值（sum）确定激活值（a = phi(sum)）。在这里，sum是它们权重中的信号之和，激活函数是这个和的新值，具有给定的函数或条件。换句话说，激活函数是将所有加权信号的和转换为该信号的新激活值的方法。有不同类型的激活函数，常用的包括线性（恒等）、双极性和逻辑（sigmoid）函数。

能在C++中创建激活函数吗？

在C++中（以及大多数编程语言），您可以创建自己的激活函数。注意，sum是净输入函数的结果，它计算所有加权信号的和。这里，人工神经元（输出值）的激活值可以通过激活函数如下所示，

通过使用这个sum 净输入函数值和phi()激活函数，我们可以编写phi()函数。让我们看看C++中的一些激活函数；现在让我们看看如何使用Mish函数作为这个示例公式，

自我规则非单调（Mish）激活函数是什么？

自我规则非单调（Mish）激活函数是受Swish激活函数启发的平滑、连续、自我规则、非单调激活函数。这个函数由Diganta Misra在2019年发表的"Mish: A Self Regularized Non-Monotonic Activation Function"中提出。

https://i0.wp.com/learncplusplus.org/wp-content/uploads/2021/05/Mish-1024x633.png?resize=750%2C464&ssl=1 图片来源：Mish A Self Regularized Non Monotonic Activation Function by Diganta Misra 2019

根据这项研究，"Mish利用自我门控属性，其中非调制输入与输入的非线性函数的输出相乘。由于保留了少量的负信息，Mish通过设计消除了Dying ReLU现象所需的先决条件。这一特性有助于更好的表达性和信息流动。Mish无界，避免了饱和，这通常会因为梯度接近零而导致训练速度大幅减慢。Mish在下方有界也是有利的，因为它产生了强烈的规则效应。与ReLU不同，Mish是连续可微的，这是一个可取的特性，因为它避免了奇异性，因此在执行基于梯度的优化时避免了不希望的副作用。"

我们之前解释了softplus()激活函数。Mish激活函数可以使用softplus()定义如下，

因此，Mish激活函数可以数学定义如下，

作者比较了Mish、ReLU、SoftPlus和Swish激活函数的输出，还比较了Mish和Swish的第一和第二导数。

Mish函数可以在C++中编写如下，

复制代码

double phi(double sum) {
    return(sum * std::tanh(std::ln(1 + std::exp(sum)))); // Mish函数
}

一个简单的C++ ANN示例使用自我规则非单调（Mish）激活函数

我们可以简单地将这个mish函数应用到我们的通用简单ANN示例中，如下所示，