【深度学习】CrossEntropyLoss需要手动softmax吗?

【深度学习】CrossEntropyLoss需要手动softmax吗?

问题:CrossEntropyLoss需要手动softmax吗?

之前用 pytorch 实现自己的网络时,使用CrossEntropyLoss的时候将网路输出经 softmax激活层后再计算CrossEntropyLoss。

答案:不需要

调用了损失函数CrossEntropyLoss,最后一层是不需要再加softmax函数激活的。

官方文档

官方文档链接:pytorch-crossentropyloss相当于在输入上应用LogSoftmax,然后NLLLoss

代码解释

python 复制代码
import torch
import torch.nn as nn
import torch.nn.functional as F

criterion = nn.CrossEntropyLoss()

# 模拟网络输出(未经过softmax)
logits = torch.tensor([[0.2447, 3, 1]], requires_grad=True)
# 模拟目标标签
target = torch.tensor([0])

# 使用Softmax + CrossEntropyLoss计算损失
softmax_layer = nn.Softmax(dim=1)
softmax_output = softmax_layer(logits)
loss_softmax_cross_entropy = criterion(softmax_output, target)
print("softmax + CrossEntropyLoss:", loss_softmax_cross_entropy.item())

# 直接使用CrossEntropyLoss计算损失
loss_cross_entropy = criterion(logits, target)
print("CrossEntropyLoss:", loss_cross_entropy.item())

# 使用LogSoftmax + NLLLoss计算损失
softmax_output = torch.softmax(logits, dim=1)
log_softmax_output = torch.log(softmax_output)
log_softmax_nll = F.nll_loss(log_softmax_output, target)
print("LogSoftmax + NLLLoss:", log_softmax_nll.item())
相关推荐
wengad3 小时前
豆包的深入研究的浅析-应用于股市投顾
人工智能
KdanMin3 小时前
“日志抓不到”到“全链路可追溯”:一次 Android 系统级日志体系的工程化实践
大数据·人工智能
apocalypsx3 小时前
深度学习-使用块的网络VGG
人工智能·深度学习
陈天伟教授3 小时前
人工智能应用-机器视觉:AI 鉴伪 07.虚假图片鉴别
人工智能·神经网络·数码相机·生成对抗网络·dnn
珠海西格电力3 小时前
零碳园区如何实现能源互联
大数据·人工智能·物联网·架构·能源
东方佑3 小时前
SamOut 架构数学证明:cusmax + 卷积 vs Softmax 注意力
人工智能
小程故事多_803 小时前
从14.3%到94.3%,破解Agent联网搜索“噪声致幻”的核心密码
人工智能·aigc
BFT白芙堂3 小时前
游戏化机器人数据采集:以Franka Research 3为核心的RoboCade创新实践
人工智能·深度学习·机器学习·机器人·具身智能·franka
草莓熊Lotso3 小时前
Qt 控件美化与交互进阶:透明度、光标、字体与 QSS 实战
android·java·开发语言·c++·人工智能·git·qt
待磨的钝刨3 小时前
目标检测三大技术路线综述:Proposal-based, Anchor-based, Anchor-free
人工智能·目标检测·计算机视觉