PyTorch中CrossEntropyLoss、BCELoss、BCEWithLogitsLoss的理解

import torch

predict =torch.Tensor(\[0.5796,0.4403,0.9087,-1.5673,-0.3150,1.6660])

#predict =torch.Tensor(\[0.5796,0.4403,-1.5673,-0.3150])

print(predict)

target =torch.tensor(0,2)

target_bce =torch.Tensor(\[1,0,0,0,0,1])

ce_loss=torch.nn.CrossEntropyLoss()

soft_max=torch.nn.Softmax(dim=-1)

sig_max=torch.nn.Sigmoid()

soft_out=soft_max(predict)

sig_out=sig_max(predict)

bce_loss=torch.nn.BCELoss()

bce_loss1=torch.nn.BCEWithLogitsLoss()

print(ce_loss(predict,target))

print(bce_loss(soft_out,target_bce))

print(bce_loss(sig_out,target_bce))

print(bce_loss1(predict,target_bce))

输出:

#predict:

tensor(\[ 0.5796, 0.4403, 0.9087,
-1.5673, -0.3150, 1.6660])

#print(ce_loss(predict,target)):

tensor(0.6725)

#print(bce_loss(soft_out,target_bce))
tensor(0.3950)

#print(bce_loss(sig_out,target_bce))

tensor(0.5900)

print(bce_loss1(predict,target_bce))
tensor(0.5900)

结论:

1.sigmoid激活+BCELoss等于BCEWithLogitsLoss

2.BCEWithLogitsLoss和CrossEntropyLoss不一样,但都可以不加激活

3.sigmoid激活+BCELoss和softmax激活+BCELoss有很大区别

相关推荐
瑶总迷弟34 分钟前
使用 mis-tei 在昇腾310P上部署 bge-m3模型
pytorch·python·华为·语言模型·自然语言处理·cnn·unix
冰西瓜6002 小时前
深度学习的数学原理(四十一)—— KV Cache
人工智能·深度学习
zhangfeng11333 小时前
ai 模型加密,强化版终极防盗方案 支持烧录的显卡列表
人工智能·pytorch·python
bubiyoushang8883 小时前
MATLAB递归神经网络(RNN)机器学习指南
rnn·神经网络·matlab
冰西瓜6005 小时前
深度学习的数学原理(四十)—— Transformer 推理全过程
人工智能·深度学习·transformer
jiayong235 小时前
AI架构师面试问题与解答 - 深度学习架构篇
人工智能·深度学习
xier_ran5 小时前
【infra之路】模块三:Kubernetes (下) — 阶段一毕业项目:在集群里跑 PyTorch 训练
pytorch·容器·kubernetes
是馒头阿6 小时前
95、仇恨与爱
深度学习·神经网络·脑机接口·神经同步采集与刺激平台·植入式脑机接口
不羁的木木6 小时前
《HarmonyOS技术精讲》三:记忆链接 ── 跨场景数据融合
pytorch·华为·harmonyos
逻辑君6 小时前
Foresight研究报告【20260014】
人工智能·深度学习