pytorch激活函数

目录

  • 1.激活函数由来
  • [2. 常见激活函数](#2. 常见激活函数)
  • [2.1 Sigmoid](#2.1 Sigmoid)
  • [2.2 Tanh](#2.2 Tanh)
  • [2.3 relu](#2.3 relu)

1.激活函数由来

科学家对青蛙的神经元进行研究的时候发现,只有超过一定的阈值青蛙才会有反应,因此不能将多个输入做简单的加权平均,而需要一个阶梯函数也就是激活函数,激活的概念也就是

单层感知机阶梯函数不连续,因此不可导

计算机神经元模型

2. 常见激活函数

2.1 Sigmoid

为了解决阶梯函数不可导的问题,科学家发明了sigmoid激活函数,sigmoid的值范围(0,1)

sigmoid常用于0~1的概率问题以及颜色RGB值的表示

sigmoid函数当x值趋于正无穷时,函数值接近1导数为0使得梯度一直得不到更新,从而产生梯度弥散的问题

梯度推导

2.2 Tanh

Tanh多用于循环神经网络RNN,Tanh值的范围为[-1,1]

梯度推导

2.3 relu

relu函数是目前用的最多的激活函数,当x<0时导数为0,x>0时导数为1,函数值x<0时为0,x>0时线性变换。

relu梯度在x>0时是1,使得梯度计算时,梯度不会放大也不会缩小,因此不容易出现梯度弥散和梯度爆炸的情况

相关推荐
张拭心7 分钟前
为什么说 AI 视频模型不能用来做教育?Sora-2 Veo-3 来了也不行
前端·人工智能
百***07458 分钟前
【保姆级教程】GPT-5.2极速接入指南:3步上手专家级多模态AI能力
人工智能·gpt
BoBoZz198 分钟前
Glyph2D 同一个图形根据点云的输入产生不同位置的输出
python·vtk·图形渲染·图形处理
SirLancelot111 分钟前
AI大模型-基本介绍(一)RAG、向量、向量数据库
数据库·人工智能·ai·向量·向量数据库·rag
一笑code11 分钟前
pycharm vs vscode安装python的插件
vscode·python·pycharm
跨境猫小妹21 分钟前
跨境电商深水区:价值增长新范式,重构出海增长逻辑
大数据·人工智能·重构·产品运营·跨境电商·防关联
imbackneverdie21 分钟前
AI工具如何重塑综述写作新体验
数据库·人工智能·考研·自然语言处理·aigc·论文·ai写作
zhaodiandiandian23 分钟前
大模型驱动AI产业化浪潮,全链条突破重塑经济生态
人工智能
liwulin050623 分钟前
【PYTHON-YOLOV8N】yoloface+pytorch+cnn进行面部表情识别
python·yolo·cnn
这儿有一堆花25 分钟前
将 AI 深度集成到开发环境:Gemini CLI 实用指南
人工智能·ai·ai编程