pytorch激活函数

目录

  • 1.激活函数由来
  • [2. 常见激活函数](#2. 常见激活函数)
  • [2.1 Sigmoid](#2.1 Sigmoid)
  • [2.2 Tanh](#2.2 Tanh)
  • [2.3 relu](#2.3 relu)

1.激活函数由来

科学家对青蛙的神经元进行研究的时候发现,只有超过一定的阈值青蛙才会有反应,因此不能将多个输入做简单的加权平均,而需要一个阶梯函数也就是激活函数,激活的概念也就是

单层感知机阶梯函数不连续,因此不可导

计算机神经元模型

2. 常见激活函数

2.1 Sigmoid

为了解决阶梯函数不可导的问题,科学家发明了sigmoid激活函数,sigmoid的值范围(0,1)

sigmoid常用于0~1的概率问题以及颜色RGB值的表示

sigmoid函数当x值趋于正无穷时,函数值接近1导数为0使得梯度一直得不到更新,从而产生梯度弥散的问题

梯度推导

2.2 Tanh

Tanh多用于循环神经网络RNN,Tanh值的范围为[-1,1]

梯度推导

2.3 relu

relu函数是目前用的最多的激活函数,当x<0时导数为0,x>0时导数为1,函数值x<0时为0,x>0时线性变换。

relu梯度在x>0时是1,使得梯度计算时,梯度不会放大也不会缩小,因此不容易出现梯度弥散和梯度爆炸的情况

相关推荐
池央4 分钟前
CANN oam-tools 诊断体系深度解析:自动化信息采集、AI Core 异常解析与 CI/CD 流水线集成策略
人工智能·ci/cd·自动化
CV@CV7 分钟前
2026自动驾驶商业化提速——从智驾平权到Robotaxi规模化落地
人工智能·机器学习·自动驾驶
财经三剑客8 分钟前
AI元年,春节出行安全有了更好的答案
大数据·人工智能·安全
ZH154558913111 分钟前
Flutter for OpenHarmony Python学习助手实战:自动化脚本开发的实现
python·学习·flutter
艾莉丝努力练剑17 分钟前
图像处理全栈加速:ops-cv算子库在CV领域的应用
图像处理·人工智能
tq108619 分钟前
AI 时代的3类程序员
人工智能
island131419 分钟前
CANN ops-nn 算子库深度解析:核心算子(如激活函数、归一化)的数值精度控制与内存高效实现
开发语言·人工智能·神经网络
xcLeigh28 分钟前
Python入门:Python3 requests模块全面学习教程
开发语言·python·学习·模块·python3·requests
xcLeigh29 分钟前
Python入门:Python3 statistics模块全面学习教程
开发语言·python·学习·模块·python3·statistics
骥龙33 分钟前
第六篇:AI平台篇 - 从Jupyter Notebook到生产级模型服务
ide·人工智能·jupyter