关于神经网络中的激活函数

这篇博客主要介绍一下神经网络中的激活函数以及为什么要存在激活函数。

首先，我先做一个简单的类比：激活函数的作用就像给神经网络里的 "数字信号" 加了一个 "智能阀门"，让机器能学会像人类一样思考复杂问题。

没有激活i函数的神经网络

没有激活i函数的神经网络就像是一台"傻机器"，假设你用纯数学公式搭一个神经网络（没有激活函数），它的计算逻辑是这样的：

输入层 → 隐藏层 ：h=W1⋅x+b1
隐藏层 → 输出层 ：y^=W2⋅h+b2

把两层合并后会发现：y^=W2⋅(W1⋅x+b1)+b2=(W2W1)⋅x+(W2b1+b2)

本质还是一个线性公式（形如 y=kx+b），只能拟合直线，连 "判断图片里有没有猫" 这种曲线问题都解决不了（因为猫和非猫的边界通常是复杂曲线）。

就像你让一个只会做加减乘除的计算器去解微积分题 ------ 它根本看不懂题目。

激活函数的核心作用是让神经网络学会 "非线性变换"，简单说就是：

ReLU 函数：f(z)=max(0,z)

作用：如果输入信号 z 是负数（比如−5），直接变成 0（相当于 "拦截"）；如果是正数（比如 3），原样输出（相当于 "放行"）。
类比：
- 你去机场过安检，包里的水如果超过 100ml（信号为负），直接被扣下（输出 0）；
- 小于 100ml 的水（信号为正），可以带进去（输出原值）。
效果：让神经网络专注于 "有意义的信号"，过滤掉干扰项，比如识别图片时只关注 "有像素的区域"，忽略全黑的背景。

Sigmoid 函数：f(z)=1+e−z1，输出永远在 0 到 1 之间。

Tanh 函数：f(z)=ez+e−zez−e−z，输出在 - 1 到 1 之间。

for example

激活函数就是在模拟这种非线性逻辑：

无激活函数的网络只能做线性运算（低级计算器）有激活函数的网络能做非线性变换（智能大脑）

一句话：激活函数让数字信号学会 "思考"，让机器从 "机械计算" 进化到 "智能决策"！