pytorch激活函数

目录

  • 1.激活函数由来
  • [2. 常见激活函数](#2. 常见激活函数)
  • [2.1 Sigmoid](#2.1 Sigmoid)
  • [2.2 Tanh](#2.2 Tanh)
  • [2.3 relu](#2.3 relu)

1.激活函数由来

科学家对青蛙的神经元进行研究的时候发现,只有超过一定的阈值青蛙才会有反应,因此不能将多个输入做简单的加权平均,而需要一个阶梯函数也就是激活函数,激活的概念也就是

单层感知机阶梯函数不连续,因此不可导

计算机神经元模型

2. 常见激活函数

2.1 Sigmoid

为了解决阶梯函数不可导的问题,科学家发明了sigmoid激活函数,sigmoid的值范围(0,1)

sigmoid常用于0~1的概率问题以及颜色RGB值的表示

sigmoid函数当x值趋于正无穷时,函数值接近1导数为0使得梯度一直得不到更新,从而产生梯度弥散的问题

梯度推导

2.2 Tanh

Tanh多用于循环神经网络RNN,Tanh值的范围为[-1,1]

梯度推导

2.3 relu

relu函数是目前用的最多的激活函数,当x<0时导数为0,x>0时导数为1,函数值x<0时为0,x>0时线性变换。

relu梯度在x>0时是1,使得梯度计算时,梯度不会放大也不会缩小,因此不容易出现梯度弥散和梯度爆炸的情况

相关推荐
不当菜鸡的程序媛27 分钟前
https://duoke360.com/post/35063
人工智能
我是华为OD~HR~栗栗呀28 分钟前
Java面经(22届考研-华oD)
java·后端·python·华为od·华为
IT_陈寒32 分钟前
SpringBoot3踩坑实录:一个@Async注解让我多扛了5000QPS
前端·人工智能·后端
毕设源码-朱学姐40 分钟前
【开题答辩全过程】以 python基于Hadoop的服装穿搭系统的设计与实现为例,包含答辩的问题和答案
开发语言·hadoop·python
_Meilinger_41 分钟前
碎片笔记|生成模型原理解读:AutoEncoder、GAN 与扩散模型图像生成机制
人工智能·生成对抗网络·gan·扩散模型·图像生成·diffusion model
十二月将至1 小时前
python读取文件的常用操作
网络·python
爱砸键盘的懒洋洋1 小时前
Python第四课:数据类型与转换
开发语言·python
Listennnn1 小时前
BEV query 式图片点云视觉特征融合
人工智能
DS-RAG1 小时前
万方智能体投票火热进行中~
人工智能
semantist@语校2 小时前
语校网500所里程碑:日本语言学校数据库的标准化与可追溯机制
大数据·数据库·人工智能·百度·语言模型·oracle·github