Pytorch损失函数-torch.nn.NLLLoss()

一、简介

1.1 nn.CrossEntropyLoss

交叉熵损失函数的定义如下:

就是我们预测的概率的对数与标签的乘积,当qk->1的时候,它的损失接近零。

1.2 nn.NLLLoss

官方文档中介绍称: nn.NLLLoss输入是一个对数概率向量和一个目标标签.

它与nn.CrossEntropyLoss的关系可以描述为:

python 复制代码
softmax(x)+log(x)+nn.NLLLoss  ==>  nn.CrossEntropyLoss

二、计算示例

2.1 softmax 函数

python 复制代码
import math
z = [1.0, 2.0, 3.0, 4.0, 1.0, 2.0, 3.0]
z_exp = [math.exp(i) for i in z]  
print(z_exp)  # Result: [2.72, 7.39, 20.09, 54.6, 2.72, 7.39, 20.09] 
sum_z_exp = sum(z_exp)  
print(sum_z_exp)  # Result: 114.98 
softmax = [round(i / sum_z_exp, 3) for i in z_exp]
print(softmax)  # Result: [0.024, 0.064, 0.175, 0.475, 0.024, 0.064, 0.175]

2.2 nn.NLLLoss

此时,nn.NLLLoss的结果就是把上面的输出与Label对应的那个值拿出来,再去掉负号,再求均值。

2.2.1 计算log概率

python 复制代码
import torch
input=torch.randn(3,3)
soft_input = torch.nn.Softmax(dim=0)
soft_input(input)
Out[20]: 
tensor([[0.7284, 0.7364, 0.3343],
        [0.1565, 0.0365, 0.0408],
        [0.1150, 0.2270, 0.6250]])

#对softmax结果取log
torch.log(soft_input(input))
Out[21]: 
tensor([[-0.3168, -0.3059, -1.0958],
        [-1.8546, -3.3093, -3.1995],
        [-2.1625, -1.4827, -0.4701]])

2.2.2 计算nill loss

假设标签是[0,1,2],第一行取第0个元素,第二行取第1个,第三行取第2个,去掉负号,即[0.3168,3.3093,0.4701],求平均值,就可以得到损失值。

python 复制代码
(0.3168+3.3093+0.4701)/3
Out[22]: 1.3654000000000002

#验证一下

loss=torch.nn.NLLLoss()
target=torch.tensor([0,1,2])
loss(input,target)
Out[26]: tensor(0.1365)

2.3 nn.CrossEntropyLoss 结果对比

python 复制代码
loss=torch.nn.NLLLoss()
target=torch.tensor([0,1,2])
loss(input,target)
Out[26]: tensor(-0.1399)
loss =torch.nn.CrossEntropyLoss()
input = torch.tensor([[ 1.1879,  1.0780,  0.5312],
        [-0.3499, -1.9253, -1.5725],
        [-0.6578, -0.0987,  1.1570]])
target = torch.tensor([0,1,2])
loss(input,target)
Out[30]: tensor(0.1365)

以上为全部实验验证两个loss函数之间的关系!!!

参考原文链接:https://blog.csdn.net/Jeremy_lf/article/details/102725285

相关推荐
向成科技1 分钟前
XC3588N工控主板助力电力巡检机器人
人工智能·rk3588·安卓·硬件·工控主板·主板
taxunjishu3 分钟前
DeviceNet 转 EtherCAT:发那科焊接机器人与倍福 CX5140 在汽车焊装线的高速数据同步通讯配置案例
人工智能·区块链·工业物联网·工业自动化·总线协议
E___V___E6 分钟前
设计模式--装饰器模式
python·设计模式·装饰器模式
sali-tec12 分钟前
C# 基于halcon的视觉工作流-章33-矩状测量
开发语言·人工智能·算法·计算机视觉·c#
格林威28 分钟前
短波红外相机在机器视觉检测方向的应用
运维·人工智能·深度学习·数码相机·计算机视觉·视觉检测
Dan.Qiao30 分钟前
pycharm如何处理python项目间引用
ide·python·pycharm
这儿有一堆花1 小时前
DeepSeek-VL 解析:混合视觉-语言模型如何超越传统计算机视觉方法
人工智能·计算机视觉·语言模型
九年义务漏网鲨鱼1 小时前
【Debug日志 | DDP 下 BatchNorm 统计失真】
pytorch
万粉变现经纪人1 小时前
如何解决pip安装报错ModuleNotFoundError: No module named ‘sympy’问题
python·beautifulsoup·pandas·scikit-learn·pyqt·pip·scipy
model20051 小时前
ubuntu24.04+5070ti训练yolo模型(2)
人工智能·yolo