pytorch激活函数

目录

  • 1.激活函数由来
  • [2. 常见激活函数](#2. 常见激活函数)
  • [2.1 Sigmoid](#2.1 Sigmoid)
  • [2.2 Tanh](#2.2 Tanh)
  • [2.3 relu](#2.3 relu)

1.激活函数由来

科学家对青蛙的神经元进行研究的时候发现,只有超过一定的阈值青蛙才会有反应,因此不能将多个输入做简单的加权平均,而需要一个阶梯函数也就是激活函数,激活的概念也就是

单层感知机阶梯函数不连续,因此不可导

计算机神经元模型

2. 常见激活函数

2.1 Sigmoid

为了解决阶梯函数不可导的问题,科学家发明了sigmoid激活函数,sigmoid的值范围(0,1)

sigmoid常用于0~1的概率问题以及颜色RGB值的表示

sigmoid函数当x值趋于正无穷时,函数值接近1导数为0使得梯度一直得不到更新,从而产生梯度弥散的问题

梯度推导

2.2 Tanh

Tanh多用于循环神经网络RNN,Tanh值的范围为[-1,1]

梯度推导

2.3 relu

relu函数是目前用的最多的激活函数,当x<0时导数为0,x>0时导数为1,函数值x<0时为0,x>0时线性变换。

relu梯度在x>0时是1,使得梯度计算时,梯度不会放大也不会缩小,因此不容易出现梯度弥散和梯度爆炸的情况

相关推荐
nvd11几秒前
python异步编程 -协程的实际意义
开发语言·python
_安晓1 分钟前
Rust 中精确大小迭代器(ExactSizeIterator)的深度解析与实践
java·前端·python
ayaya_mana5 分钟前
CentOS 7/8/9 一键安装 Python 3.10+ 并配置默认版本
linux·python·centos
格兰芬多呼神护卫18 分钟前
python实现Latex格式的公式转OMML并写入word
python·c#·word
Elastic 中国社区官方博客33 分钟前
Elastic AI agent builder 介绍(三)
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索
这张生成的图像能检测吗1 小时前
(论文速读)YOLA:学习照明不变特征的低光目标检测
图像处理·人工智能·目标检测·计算机视觉·低照度
ZPC82101 小时前
opencv 获取图像中物体的坐标值
人工智能·python·算法·机器人
亚里随笔1 小时前
AsyPPO_ 轻量级mini-critics如何提升大语言模型推理能力
人工智能·语言模型·自然语言处理·llm·agentic
coding_ksy1 小时前
基于启发式的多模态风险分布越狱攻击,针对多模态大型语言模型(ICCV 2025) - 论文阅读和解析
人工智能·语言模型
测试19981 小时前
如何写出一个完整的测试用例?
自动化测试·软件测试·python·测试工具·职场和发展·测试用例·接口测试