损失函数-二分类和多分类

二分类和多分类的损失函数

二分类

  • 损失函数
    L ( y , y ^ ) = − ( y l o g ( y ^ ) ) + ( 1 − y ) l o g ( 1 − y ^ ) L(y,\hat{y}) = -(ylog(\hat{y})) + (1-y)log(1-\hat{y}) L(y,y^)=−(ylog(y^))+(1−y)log(1−y^)

    其中真实标签表示为y(取值为 0 或 1),预测概率表示为 y ^ \hat{y} y^(取值在 0 到 1 之间)

  • 代码

    import torch
    import torch.nn as nn

    criterion = nn.BCELoss() # 或者使用 nn.BCEWithLogitsLoss() BCEWithLogitsLoss可以直接接收logit输出

    假设模型的输出 logits

    logits = torch.tensor([0.2, 0.8, 0.5, 0.1]) #shape: (4, 1)
    predicted_probabilities = torch.sigmoid(logits) #shape: (4, 1)

    真实标签

    labels = torch.tensor([0.0, 1.0, 1.0, 0.0]) #shape: (4, 1)

    计算损失

    loss = criterion(predicted_probabilities, labels)
    print("Loss:", loss.item())

  • 可视化损失值
    对于输出的loss值,我们往往不能理解这个loss是好还是坏,我们重看损失函数,发现对于单个正样本来说:
    l o s s = − l o g ( y ^ ) loss = -log(\hat{y}) loss=−log(y^)
    对于单个负样本来说:
    l o s s = − l o g ( 1 − y ^ ) loss = -log(1-\hat{y}) loss=−log(1−y^)
    从这个公式我们可以反推模型对正样本预测的概率为:
    h i t p o s = e − l o s s hit_{pos} = e^{-loss} hitpos=e−loss
    对负样本预测的概率为:
    h i t n e g = 1 − e − l o s s hit_{neg} = 1-e^{-loss} hitneg=1−e−loss
    这个hit就比较形象了,$hit_{pos}$越接近1,说明正样本的预测效果效果越好,$hit_{neg}$越接近0,说明负样本的预测效果效果越好

多分类

  • 损失函数
    L ( y , y ^ ) = − ∑ c = 1 C y l o g ( y ^ ) L(y,\hat{y}) = -\sum_{c=1}^Cylog(\hat{y}) L(y,y^)=−c=1∑Cylog(y^)
    其中真实标签表示为y(取值为 0 或 1,表示是否属于第c类),预测概率表示为$\hat{y}$ (取值在 0 到 1 之间)

  • 代码

    import torch
    import torch.nn as nn

    criterion = nn.CrossEntropyLoss()

    假设模型的输出 logits(未经过 sigmoid)

    logits = torch.tensor([[1.0, 2.0], # 类别 0 和 1 的 logits
    [0.0, 1.0],
    [0.5, 0.5],
    [0.0, 0.0]]) # shape:(4,2)

    真实标签,格式为类别索引

    0 表示第一个类别,1 表示第二个类别

    labels = torch.tensor([1, 1, 0, 0]) # shape:(1,4)

    计算损失

    loss = criterion(logits, labels)

    print("Loss:", loss.item())

  • 可视化损失值
    对于输出的loss值,我们往往不能理解这个loss是好还是坏,我们重看损失函数,发现对于单个样本来说:
    l o s s = − l o g ( y ^ ) loss = -log(\hat{y}) loss=−log(y^)
    从这个公式我们可以反推模型对当前样本的正确类别预测的概率为:
    h i t = e − l o s s hit = e^{-loss} hit=e−loss
    这个hit就比较形象了,hit越接近1,说明效果越好

二分类和多分类区别

  • 从损失函数的物理含义上来看,二分类的损失函数不仅希望正样本输出概率接近1,并且希望负样本的输出概率接近0;而多分类的损失函数仅仅希望正样本输出概率接近1,对于负样本其实没有约束
  • 对于二分类问题:如果你希望模型不仅能找出正样本,而且筛掉副样本,就用二分类损失。如果你仅仅希望找出正样本而不管负样本,多分类的损失也能用。

多分类问题中评价问题

TP(True Positive):真实标签为正类,模型预测为正类的样本数量。

TN(True Negative):真实标签为负类,模型预测为负类的样本数量。

FP(False Positive):真实标签为负类,但模型预测为正类的样本数量。

FN(False Negative):真实标签为正类,但模型预测为负类的样本数量。

  • 准确率acc

    关心模型预测的能力
    a c c = T P + T N T P + F P + F N + T N acc = \frac{TP+TN}{TP+FP+FN+TN} acc=TP+FP+FN+TNTP+TN

  • 精准率pre

    关心模型预测负样本能力
    p r e = T P T P + F P pre = \frac{TP}{TP+FP} pre=TP+FPTP

  • 召回率Recall

    关心模型预测正样本的能力
    r e c a l l = T P T P + F N recall = \frac{TP}{TP+FN} recall=TP+FNTP

相关推荐
产业家4 分钟前
2025年,百度智能云打响AI落地升维战
人工智能·百度
扫地的小何尚10 分钟前
NVIDIA Dynamo:数据中心规模的分布式推理服务框架深度解析
人工智能·分布式·microsoft·链表·语言模型·gpu
SailingCoder16 分钟前
grafana-mcp-analyzer:基于 MCP 的轻量 AI 分析监控图表的运维神器!
运维·人工智能·typescript·node.js·grafana
程序员老周66618 分钟前
4.大语言模型预备数学知识
人工智能·神经网络·线性代数·自然语言处理·大语言模型·概率论·数学基础
Coovally AI模型快速验证19 分钟前
AI+无人机如何守护濒危物种?YOLOv8实现95%精准识别
人工智能·神经网络·yolo·目标检测·无人机·cocos2d
zskj_zhyl24 分钟前
智绅科技 —— 智慧养老 + 数字健康,构筑银发时代安全防护网
人工智能·科技·安全
s1533532 分钟前
11.RV1126-ROCKX项目
人工智能
MYH51636 分钟前
RNN和CNN使用场景区别
rnn·深度学习·cnn
是小菜呀!1 小时前
深度学习环境配置指南:基于Anaconda与PyCharm的全流程操作
人工智能·深度学习·pycharm
2401_876907521 小时前
IEC 61347-1:2015 灯控制装置安全标准详解
大数据·数据结构·人工智能·算法·安全·学习方法