【深度学习】神经网络之Softmax

dundunmm2025-01-18 20:05

Softmax 函数是神经网络中常用的一种激活函数，尤其在分类问题中广泛应用。它将一个实数向量转换为概率分布，使得每个输出值都位于 [0, 1] 之间，并且所有输出值的和为 1。这样，Softmax 可以用来表示各类别的预测概率。

给定一个实数向量 z=[z1,z2,...,zn]，Softmax 函数的输出是一个概率分布，定义如下：

其中：

多类分类问题：在神经网络的输出层，Softmax 通常用于多分类问题，例如图像分类、文本分类等。它将每个类别的原始预测值（即神经网络的输出）转换为概率，从而能够判断输入属于每个类别的概率。
回归任务：虽然 Softmax 主要用于分类问题，但在某些情况下它也可以应用于回归任务中的概率预测。

假设有一个网络的输出向量 z=[2,1,0.1]，我们想计算该向量通过 Softmax 函数后的输出：

最终，Softmax 输出的概率分布为 [0.659,0.242,0.099]，即该网络认为输入属于第一个类别的概率为 65.9%，属于第二个类别的概率为 24.2%，属于第三个类别的概率为 9.9%。

Softmax 是神经网络中用于多类分类问题的常见激活函数，通过将网络的输出转化为概率分布，帮助我们理解模型的预测结果，并且通过概率值判断输入属于各类别的可能性。