pytorch-10 神经网络的损失函数

1. 回归:SSE和MSE

python 复制代码
# MSE损失函数
import torch
from torch.nn import MSELoss

yhat = torch.randn(size=(50,), dtype=torch.float32)
y = torch.randn(size=(50,), dtype=torch.float32)

criterion = MSELoss()
loss1 = criterion(yhat, y)

# 计算mse 误差平方
criterion = MSELoss(reduction="mean")
loss2 = criterion(yhat, y)

# 计算sse
criterion = MSELoss(reduction="sum")
loss3 = criterion(yhat, y)

loss1, loss2, loss3

2. BCELoss二分类交叉熵损失函数

方法1:nn模块中的类

  • class BCEWithLogitsLoss

  • class BCELoss
    方法2:functional库中的计算函数 (很少用到)

  • function F.binary_cross_entropy_with_logits

  • function F.binary_cross_entropy

python 复制代码
# 二分类交叉熵损失函数 方法一、手动实现 BCELoss
import torch

N = 3*pow(10,3)
torch.random.manual_seed(420)
X = torch.rand((N,4),dtype=torch.float32)
w = torch.rand((4,1),dtype=torch.float32,requires_grad=True)
y = torch.randint(low=0,high=2,size=(N,1),dtype=torch.float32)

zhat = torch.mm(X,w)
sigma = torch.sigmoid(zhat)

loss = -(1/N) * torch.sum( (1-y)*torch.log(1-sigma) + y*torch.log(sigma) )  # binary cross entropy loss
loss
python 复制代码
# BCELoss 方法二、使用类
import torch
import torch.nn as nn

# X, w, y
# zhat, sigma(sigmoid)

criterion = nn.BCELoss()  # 不带sigmoid函数, 主要为了监控准确率
loss1 = criterion(sigma, y)

criterion = nn.BCEWithLogitsLoss()  # 带有sigmoid函数
loss2 = criterion(zhat, y)

loss1, loss2
python 复制代码
# BCELoss 方法三、使用函数
import torch
from torch.nn import functional as F

# X, w, y
# zhat, sigma(sigmoid)

loss1 = F.binary_cross_entropy(sigma, y) # 没有sigmoid函数
loss2 = F.binary_cross_entropy_with_logits(zhat, y) # 有sigmoid函数

loss1, loss2

3. CrossEntropyLoss 多分类交叉熵损失函数

方法1:调用logsoftmax和NLLLoss实现

方法2:直接调用CrossEntropyLoss

python 复制代码
# 多分类交叉熵损失函数
import torch
import torch.nn as nn

N = 3*pow(10,2)
torch.random.manual_seed(420)
X = torch.rand((N,4),dtype=torch.float32)
w = torch.rand((4,3),dtype=torch.float32,requires_grad=True)
y = torch.randint(low=0,high=2,size=(N,),dtype=torch.float32)
python 复制代码
# 方法一、LogSoftmax 和 NLLLoss
zhat = torch.mm(X,w)
logsm = nn.LogSoftmax(dim=1)
logsigma = logsm(zhat)

criterion = nn.NLLLoss() # 将标签转化成 独热编码,01的稀疏矩阵,类型是Long
loss1 = criterion(logsigma, y.long())
python 复制代码
# 方法二、CrossEntropyLoss
criterion = nn.CrossEntropyLoss()  # 属性reduction的值,mean、sum、None
loss2 = criterion(zhat, y.long())

criterion = nn.CrossEntropyLoss(reduction="mean")  # 属性reduction的值,mean、sum、none
loss_mean = criterion(zhat, y.long())

criterion = nn.CrossEntropyLoss(reduction="sum")  # 属性reduction的值,mean、sum、none
loss_sum = criterion(zhat, y.long())

criterion = nn.CrossEntropyLoss(reduction="none") # 没有聚合函数的聚合效果
loss_none = criterion(zhat, y.long())

loss1, loss2, loss_mean, loss_sum, loss_none
相关推荐
羊小猪~~6 分钟前
【NLP入门系列四】评论文本分类入门案例
人工智能·自然语言处理·分类
roman_日积跬步-终至千里10 分钟前
【学习线路】机器学习线路概述与内容关键点说明
人工智能·学习·机器学习
静心问道15 分钟前
APE:大语言模型具有人类水平的提示工程能力
人工智能·算法·语言模型·大模型
zskj_zhyl18 分钟前
科技有温度:七彩喜智慧康养平台,为银发生活织就“数字守护网”
人工智能·科技·生活
嘉讯科技HIS系统21 分钟前
嘉讯科技:医疗信息化、数字化、智能化三者之间的关系和区别
大数据·数据库·人工智能·科技·智慧医疗
音视频牛哥23 分钟前
计算机视觉的新浪潮:扩散模型(Diffusion Models)技术剖析与应用前景
人工智能·计算机视觉·ai·音视频·实时音视频·扩散模型
爆改模型25 分钟前
【arXiv2025】计算机视觉|即插即用|LBMamba:革新视觉模型效率,性能炸裂
人工智能·计算机视觉
巴里巴气2 小时前
安装GPU版本的Pytorch
人工智能·pytorch·python
「、皓子~2 小时前
后台管理系统的诞生 - 利用AI 1天完成整个后台管理系统的微服务后端+前端
前端·人工智能·微服务·小程序·go·ai编程·ai写作
说私域2 小时前
基于开源AI智能名片链动2+1模式S2B2C商城小程序的抖音渠道力拓展与多渠道利润增长研究
人工智能·小程序·开源