分类损失函数 (一) torch.nn.CrossEntropyLoss()

1、交叉熵

  • 是一种用于衡量两个概率分布之间的距离或相似性的度量方法。
  • 机器学习中,交叉熵常用于损失函数,用于评估模型的预测结果和实际标签的差异。
  • 公式:

y:真是标签的概率分布,y':模型预测的概率分布

  • 交叉熵损失函数的目的:是最小化预测概率分布和真是概率分布之间的差异,使模型能够更好的学习到数据的内在规律和特征。

2、pytorch中的CrossEntropyLoss()

  • pytorch中的交叉熵包含两部分,softmax和交叉熵计算
  • softmax将预测值转化为概率值
  • torch.nn.CrossEntropyLoss(logits,target)

其中logits预测值是网络输出:[[0.8, 0.5, 0.2, 0.5],

0.2, 0.9, 0.3, 0.2\], \[0.4, 0.3, 0.7, 0.1\], \[0.1, 0.2, 0.4, 0.8\]

其中target标签可以是:列表:torch.tensor([[1, 0, 0, 0],

0, 1, 0, 0\], \[0, 1, 0, 0\], \[0, 0, 0, 1\]\], dtype=torch.float) 索引:torch.tensor(\[0,1, 1, 3\], dtype=torch.long)

相关推荐
昨日之日2006几秒前
Z-Image - 低配电脑玩转高质量极速文生图 6G显存可用 支持批量 支持50系显卡 WebUI+ComfyUI工作流 一键整合包下载
人工智能·ai绘画
AI即插即用3 分钟前
即插即用系列 | WPFormer:基于小波与原型增强的双域 Transformer 表面缺陷检测网络
人工智能·深度学习·目标检测·计算机视觉·视觉检测·transformer
roman_日积跬步-终至千里4 分钟前
【计算机视觉(2)】图像几何变换基础篇:从平移旋转到投影变换
人工智能·算法·计算机视觉
小oo呆5 分钟前
【自然语言处理与大模型】三种实现多模态技术的路线
人工智能·自然语言处理
vi121237 分钟前
农业图像预处理技术学习综述:原理、实现与应用
人工智能·学习
亚里随笔7 分钟前
SAPO:软自适应策略优化——大语言模型强化学习训练的稳定新范式
人工智能·深度学习·机器学习·语言模型·大语言模型·rlhf
hy15687867 分钟前
看好大模型技术,不看好“AI 手机”现状
人工智能·热点乱评
cyyt9 分钟前
深度学习周报(12.1~12.7)
人工智能·深度学习
优质网络系统领域创作者10 分钟前
华为链路聚合原理
人工智能·华为
围炉聊科技11 分钟前
Orchestrator-8B:近期HuggingFace上火热的小型模型
人工智能