【pytorch22】激活函数与GPU加速

激活函数


ReLu还是还是可能出现梯度弥散,因为x<0的时候,梯度还是可能小于0

leaky relu,在x<0的时候,梯度就不会为0,梯度不会不动

Relu函数在x=0处是不连续的

一种更加光滑的曲线是SELU,是两个函数的concat

softplus,把ReLu的尖点x=0做了一个平滑处理,使得导数不连续的地方导数连续

目前用的最多的是Relu、sigmoid,tan h(RNN)以及Leaky Relu

GPU加速

loss层也是需要计算的,可以把loss层也搬到GPU上去

相关推荐
纠结哥_Shrek7 小时前
pytorch逻辑回归实现垃圾邮件检测
人工智能·pytorch·逻辑回归
辞落山7 小时前
自定义数据集,使用 PyTorch 框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测
人工智能·pytorch·逻辑回归
纠结哥_Shrek9 小时前
pytorch使用SVM实现文本分类
pytorch·支持向量机·分类
AI视觉网奇16 小时前
解决ImportError: cannot import name ‘notf‘
人工智能·pytorch·python
jax不摆烂19 小时前
Jetson Xavier NX 安装 CUDA 支持的 PyTorch 指南
人工智能·pytorch·python
弥树子19 小时前
使用 PyTorch 实现线性回归:从零开始的完整指南
人工智能·pytorch·线性回归
kakaZhui19 小时前
【llm对话系统】大模型源码分析之llama模型的long context更长上下文支持
pytorch·深度学习·chatgpt·aigc·llama
Sherlock Ma1 天前
qwen2.5-vl:阿里开源超强多模态大模型(包含使用方法、微调方法介绍)
人工智能·pytorch·深度学习·语言模型·nlp·aigc·transformer
Icomi_1 天前
【PyTorch】5.张量索引操作
人工智能·pytorch·python·深度学习·神经网络·机器学习·计算机视觉
Francek Chen2 天前
【现代深度学习技术】深度学习计算 | 参数管理
人工智能·pytorch·深度学习·神经网络·参数管理