【深度学习】CrossEntropyLoss需要手动softmax吗?

【深度学习】CrossEntropyLoss需要手动softmax吗?

问题:CrossEntropyLoss需要手动softmax吗?

之前用 pytorch 实现自己的网络时,使用CrossEntropyLoss的时候将网路输出经 softmax激活层后再计算CrossEntropyLoss。

答案:不需要

调用了损失函数CrossEntropyLoss,最后一层是不需要再加softmax函数激活的。

官方文档

官方文档链接:pytorch-crossentropyloss相当于在输入上应用LogSoftmax,然后NLLLoss

代码解释

python 复制代码
import torch
import torch.nn as nn
import torch.nn.functional as F

criterion = nn.CrossEntropyLoss()

# 模拟网络输出(未经过softmax)
logits = torch.tensor([[0.2447, 3, 1]], requires_grad=True)
# 模拟目标标签
target = torch.tensor([0])

# 使用Softmax + CrossEntropyLoss计算损失
softmax_layer = nn.Softmax(dim=1)
softmax_output = softmax_layer(logits)
loss_softmax_cross_entropy = criterion(softmax_output, target)
print("softmax + CrossEntropyLoss:", loss_softmax_cross_entropy.item())

# 直接使用CrossEntropyLoss计算损失
loss_cross_entropy = criterion(logits, target)
print("CrossEntropyLoss:", loss_cross_entropy.item())

# 使用LogSoftmax + NLLLoss计算损失
softmax_output = torch.softmax(logits, dim=1)
log_softmax_output = torch.log(softmax_output)
log_softmax_nll = F.nll_loss(log_softmax_output, target)
print("LogSoftmax + NLLLoss:", log_softmax_nll.item())
相关推荐
Java中文社群几秒前
太顶了!全网最全的600+图片生成玩法!
人工智能
阿里云大数据AI技术6 分钟前
EMR AI 助手开启公测:用 AI 重塑大数据运维,更简单、更智能
人工智能
言之。9 分钟前
AI时代的UI发展
人工智能·ui
拖拖76519 分钟前
从“死”文档到“活”助手:Paper2Agent 如何将科研论文一键转化为可执行 AI
人工智能
攻城狮7号22 分钟前
告别显存焦虑:阿里开源 Z-Image 如何用 6B 参数立足AI 绘画时代
人工智能·ai 绘画·qwen-image·z-image-turbo·阿里开源模型
Christo323 分钟前
ICML-2019《Optimal Transport for structured data with application on graphs》
人工智能·算法·机器学习·数据挖掘
阿杰学AI27 分钟前
AI核心知识24——大语言模型之AI 幻觉(简洁且通俗易懂版)
人工智能·ai·语言模型·aigc·hallucination·ai幻觉
AI_567827 分钟前
AI知识库如何重塑服务体验
大数据·人工智能
公众号-架构师汤师爷31 分钟前
n8n工作流实战:让DeepSeek一键拆解100篇公众号爆文,扒得底裤都不剩(建议收藏)
人工智能·智能体·n8n
一只乔哇噻36 分钟前
java后端工程师+AI大模型进修ing(研一版‖day57)
java·开发语言·人工智能·算法·语言模型