激活函数选型速查表(核心规则)

应用位置 任务场景 首选激活函数 备选 / 优化方案 核心原因
隐藏层 传统 CNN / 全连接网络 ReLU Leaky ReLU(防死神经元) 计算快、无梯度消失、兼容性好
隐藏层 Transformer/LLM/ 现代模型 GELU Swish/Mish 平滑非线性、训练更稳定
输出层 回归(任意连续值) 无激活(线性) - 输出无范围限制
输出层 回归(非负连续值) ReLU Softplus 保证输出≥0
输出层 二分类(0/1) Sigmoid - 输出 (0,1) 可表示概率
输出层 多分类(互斥) Softmax - 输出和为 1 的类别概率
输出层 多标签分类(共存) Sigmoid(逐标签) - 每个标签独立输出 0-1 概率

激活函数必须和损失函数配对 (否则训练失效)「激活函数必须和损失函数配对」仅针对输出层,和隐藏层无关。

任务类型 激活函数 对应损失函数
回归(连续任意值) 无激活(线性) MSE、MAE、Huber
回归(非负连续值) ReLU MSE
二分类(0/1) Sigmoid 二元交叉熵(BCE)
多分类(互斥类别) Softmax 类别交叉熵
多标签分类(多标签共存) Sigmoid(逐标签) 二元交叉熵
相关推荐
狂龙骄子15 小时前
键盘布局编辑器Keyboard Layout Editor
编辑器·keyboard·layout editor·keyboard layout·键盘布局编辑器·键盘布局设计
zhensherlock16 小时前
Protocol Launcher 系列:Trae AI 编辑器的深度集成
javascript·人工智能·vscode·ai·typescript·编辑器·ai编程
Never_Satisfied17 小时前
将web服务绑定在 1024 以下的端口上
前端·编辑器·vim
山峰哥1 天前
查询优化案例:从慢查询到闪电般的查询速度
数据库·sql·性能优化·编辑器·深度优先
今天也是爱大大的一天吖2 天前
vscode迁移插件至cursor的三个法子
ide·vscode·编辑器·cursor
阴暗扭曲实习生2 天前
135编辑器素材管理系统的技术架构
架构·编辑器
山峰哥2 天前
SQL优化实战:从索引策略到执行计划的极致突破
数据库·sql·性能优化·编辑器·深度优先
咬人喵喵3 天前
植树节主题核心 SVG 交互玩法 + 品牌 / 账号案例 + 组件 / 教程
前端·css·编辑器·svg·e2编辑器
阴暗扭曲实习生3 天前
基于135编辑器的SaaS/PaaS服务集成实践
java·编辑器·paas
夏至xz3 天前
类似 typora 的新一代 Markdown 编辑器
编辑器·typora·markdown·milkup·milkdown