【深度学习】CrossEntropyLoss需要手动softmax吗?

【深度学习】CrossEntropyLoss需要手动softmax吗?

问题:CrossEntropyLoss需要手动softmax吗?

之前用 pytorch 实现自己的网络时,使用CrossEntropyLoss的时候将网路输出经 softmax激活层后再计算CrossEntropyLoss。

答案:不需要

调用了损失函数CrossEntropyLoss,最后一层是不需要再加softmax函数激活的。

官方文档

官方文档链接:pytorch-crossentropyloss相当于在输入上应用LogSoftmax,然后NLLLoss

代码解释

python 复制代码
import torch
import torch.nn as nn
import torch.nn.functional as F

criterion = nn.CrossEntropyLoss()

# 模拟网络输出(未经过softmax)
logits = torch.tensor([[0.2447, 3, 1]], requires_grad=True)
# 模拟目标标签
target = torch.tensor([0])

# 使用Softmax + CrossEntropyLoss计算损失
softmax_layer = nn.Softmax(dim=1)
softmax_output = softmax_layer(logits)
loss_softmax_cross_entropy = criterion(softmax_output, target)
print("softmax + CrossEntropyLoss:", loss_softmax_cross_entropy.item())

# 直接使用CrossEntropyLoss计算损失
loss_cross_entropy = criterion(logits, target)
print("CrossEntropyLoss:", loss_cross_entropy.item())

# 使用LogSoftmax + NLLLoss计算损失
softmax_output = torch.softmax(logits, dim=1)
log_softmax_output = torch.log(softmax_output)
log_softmax_nll = F.nll_loss(log_softmax_output, target)
print("LogSoftmax + NLLLoss:", log_softmax_nll.item())
相关推荐
智算菩萨35 分钟前
走向通用智能的大语言模型:具身、符号落地、因果与记忆的统一认知视角
人工智能·语言模型·自然语言处理
算家计算38 分钟前
千问一周破千万下载背后:AI应用需求的爆发与生态竞赛
人工智能·aigc·资讯
算家计算39 分钟前
基于GitHub Actions与算力平台API:构建端到端的模型自动训练与部署流水线
人工智能·机器学习
CharlieWang1 小时前
AI Elements Vue,帮助你更快的构建 AI 应用程序
前端·人工智能·chatgpt
人工智能训练1 小时前
在Windows系统Docker中使用wsl2、容器、windows文件路径三种不同挂载方式的区别和性能差异
运维·服务器·人工智能·windows·docker·容器·wsl2
数据智研1 小时前
【数据分享】中国税务年鉴(1993-2024)(1998缺失)
大数据·人工智能·信息可视化·数据分析
麻雀无能为力1 小时前
多媒体常用特征处理技术梳理
人工智能·深度学习·神经网络
居然JuRan2 小时前
部署大模型需要多少GPU显存?一文教你精准计算
人工智能
数据库知识分享者小北2 小时前
阿里云「RDS AI助手」正式上线:大模型驱动的数据库智能运维Copilot
人工智能