神经网络基础-神经网络补充概念-20-激活函数

概念

激活函数是神经网络中的一个重要组成部分,它引入了非线性性质,使得神经网络可以学习和表示更复杂的函数关系。激活函数对于将输入信号转换为输出信号起到了关键作用,它在神经元的计算过程中引入了非线性变换。

几种常见的激活函数及其特点

Sigmoid函数:

Sigmoid 函数将输入映射到一个 0 到 1 的范围,它的公式是:f(x) = 1 / (1 + exp(-x))。

特点:Sigmoid 函数在输入很大或很小时,输出接近于0或1,适合用于输出层进行二分类问题的概率估计。但它在远离零点时梯度接近于零,可能导致梯度消失问题。

ReLU函数(Rectified Linear Unit):

ReLU 函数将负数输入变为零,非负数输入保持不变,它的公式是:f(x) = max(0, x)。

特点:ReLU 对于正数输入有很强的激活作用,能够缓解梯度消失问题。但存在一个问题,即在训练过程中可能出现"神经元死亡"现象,即某些神经元永远不会被激活。

Leaky ReLU函数:

Leaky ReLU 是对 ReLU 的改进,它在负数区域引入一个小的斜率,公式是:f(x) = x (x > 0),f(x) = ax (x <= 0),其中 a 是一个小于 1 的常数。

特点:Leaky ReLU 克服了 ReLU 的神经元死亡问题,但仍然能够引入一些非线性。

Tanh函数(双曲正切函数):

Tanh 函数将输入映射到 -1 到 1 的范围,公式是:f(x) = (exp(x) - exp(-x)) / (exp(x) + exp(-x))。

特点:Tanh 函数可以将输入的负值映射到负区间,适合用于隐藏层中。但仍然存在梯度消失问题。

Softmax函数:

Softmax 函数将一组实数映射到概率分布,用于多分类问题。它的公式是:f(x_i) = exp(x_i) / sum(exp(x_j)),其中 i 表示第 i 个类别。

特点:Softmax 函数用于多分类输出,将神经网络的输出转换为概率分布。

代码实现

python 复制代码
import numpy as np

def sigmoid(x):
    return 1 / (1 + np.exp(-x))
python 复制代码
import numpy as np

def relu(x):
    return np.maximum(0, x)
python 复制代码
import numpy as np

def leaky_relu(x, alpha=0.01):
    return np.where(x > 0, x, alpha * x)
python 复制代码
import numpy as np

def tanh(x):
    return np.tanh(x)
python 复制代码
import numpy as np

def softmax(x):
    exp_x = np.exp(x - np.max(x, axis=-1, keepdims=True))
    return exp_x / np.sum(exp_x, axis=-1, keepdims=True)
相关推荐
IT_陈寒13 小时前
Vue这个坑我跳了两次,原来问题出在这
前端·人工智能·后端
新新技术迷14 小时前
Node给AI接口做SSE代理与鉴权
人工智能
redreamSo14 小时前
大模型是不是到顶了?瓶颈到底在哪
人工智能·openai
Oo92014 小时前
Tool Use 背后的技术逻辑
人工智能
姗姗来迟了14 小时前
Vue3封装AI流式对话组件踩坑实录
人工智能
码上天下15 小时前
用Pinia管理AI多会话状态
人工智能
用户0543243297016 小时前
Next.js接大模型流式SSE实操踩坑
人工智能
Assby16 小时前
从 Function Calling 到 MCP:理解 Agent 工具调用的底层通信机制
人工智能·后端
小星AI16 小时前
Claude Code 从入门到精通,一步到位
人工智能
后端小肥肠16 小时前
Codex + Obsidian 做人生副本视频:输入主题文案,直通剪映草稿
人工智能·aigc·agent