常用的激活函数

激活函数最大的作用:向线性模型中注入非线性

1.Sigmoid

公式:

输出范围为[0,1]

缺点:

梯度消失问题

2.Tanh

公式:

输出范围[-1,1]

缺点:未完全解决梯度消失问题

3.ReLU

公式:

输出范围[0,+∞]

缺点:若有些神经元始终小于0,会导致其始终无法更新。

4.Leaky Relu

公式:

输出范围[-∞,+∞]

缺点:超参数 α 需手动调优

5.PRelu

公式:

为可学习参数,通过反向传播更新

缺点:增加模型复杂度,需限制 α>0

6.ELU

公式:

7.selu

公式:

缺点:计算复杂度高,网络结构不支持RNN/LSTM(时序数据的自归一化条件不满足)

8.swish

公式:

兼具 "梯度平滑、无死亡神经元、自适应特征权重" 三大优势

9.mish

公式:

缺点:计算复杂度高,指数溢出风险。小数据容易过拟合

10.softmax

公式:

相关推荐
Aleeeeex4 小时前
RAG 那点事:从 8 份企业文档到能用的问答系统,全过程拆给你看
人工智能·python·ai编程
冬奇Lab4 小时前
一天一个开源项目(第87篇):Tank-OS —— Red Hat 工程师用一个周末,把 AI Agent 塞进了一个可启动的 Linux 镜像
人工智能·开源·资讯
小糖学代码4 小时前
LLM系列:2.pytorch入门:8.神经网络的损失函数(criterion)
人工智能·深度学习·神经网络
Captaincc4 小时前
转发-中央网信办部署开展“清朗·整治AI应用乱象”专项行动
人工智能·vibecoding
AI自动化工坊4 小时前
Late框架技术深度解析:5GB VRAM实现10倍AI编码效率的工程架构
人工智能·5g·架构·ai编程·late
我是大聪明.5 小时前
DeepSeek V4 Pro + 华为昇腾910:国产大模型落地的性能实测与深度解析
人工智能·华为
机器之心5 小时前
Generalist之后,罗剑岚团队推出LWD,也要变革具身智能训练范式
人工智能·openai
IT_陈寒5 小时前
Vite的public文件夹放静态资源?这坑我替你踩了
前端·人工智能·后端
传说故事5 小时前
【论文阅读】Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion
论文阅读·人工智能·diffusion
xixixi777775 小时前
三重筑基:5G-A超级上行提速千兆,电联低频共享扫平盲点,800V HVDC算电协同破局
人工智能·5g·ai·大模型·算力·通信·信通院