PyTorch -- 最常见损失函数 LOSS 的选择

  • 损失函数 :度量模型的预测结果与真实值之间的差异;通过最小化 loss -> 最大化模型表现
  • 代码实现框架:设有 模型预测值 f (x), 真实值 y
    • 方法一: 步骤 1. criterion = torch.nn.某个Loss();步骤 2. loss = criterion(f(x), y)
    • 方法二:直接采用 F.某个_loss(f(x), y)

回归损失(Regression Loss):希望预测值和真实值接近,即 f(x) = y

  • torch.nn.L1Loss()】平均绝对值误差 MAE(Mean Abs Error): f (x) 和 y 之间差的绝对值的平均值
    • 具体数学计算公式: Loss = 1 n ∑ i = 0 n ∣ f ( x i ) − y i ∣ \text{Loss}=\frac{1}{n}\sum^n_{i=0} |f(x_i)-y_i| Loss=n1∑i=0n∣f(xi)−yi∣
    • 注:L1 损失, 主要用于回归问题和简单的模型,所以很少使用
  • torch.nn.MSELoss()】平均平方误差 MSE(Mean Squared Error): f (x) 和 y 之间差的平方的平均值
    • 具体数学计算公式: Loss = 1 n ∑ i = 0 n ( f ( x i ) − y i ) 2 \text{Loss}=\frac{1}{n}\sum^n_{i=0} (f(x_i)-y_i)^2 Loss=n1∑i=0n(f(xi)−yi)2: F.mse_loss(f(x), y)
    • 注:L2 损失, 很常用

分类损失(Classification Loss):希望分类准确率高等

  • torch.nn.CrossEntropyLoss()】分类交叉熵损失 CEL(Cross Entropy Loss): 和 KL divergence (衡量两个分布的相似度) 有关
    • 具体数学计算公式: − ∑ y i j log ⁡ ( f ( x i ) j ) -\sum y_{ij}\log(f(x_i)_j) −∑yijlog(f(xi)j), 注意其中 f ( x i ) f(x_i) f(xi) 表示模型预测出的概率值如 [0.1, 0.7, 0.2]: F.cross_entropy(直接传入 logits (已打包了 softmax))
    • 通常和 softmax (soft version of max S ( y i ) = e y i ∑ e y i S(y_i) = \frac{e^{y_i}}{\sum e^{y_i}} S(yi)=∑eyieyi: F.softmax(y)) 搭配使用 (softmax 负责产生上述概率输出)
    • logistic regression (按sigmoid输出的概率大小分类) 已被 classification 代替

相关推荐
MATLAB代码顾问1 小时前
5大智能算法优化标准测试函数对比(Python实现)
开发语言·python
ting94520001 小时前
Tornado 全栈技术深度指南:从原理到实战
人工智能·python·架构·tornado
果汁华1 小时前
Browserbase Skills:让 Claude Agent 真正“看见“网页世界
人工智能·python
ZhengEnCi1 小时前
04-缩放点积注意力代码实现 💻
人工智能·python
DeepReinforce2 小时前
三、AI量化投资:使用akshare获取A股主板20260430所有的涨停股票
python·量化·akshare·龙头战法
HackTwoHub2 小时前
AI大模型网关存在SQL注入、附 POC 复现、影响版本LiteLLM 1.81.16~1.83.7(CVE-2026-42208)
数据库·人工智能·sql·网络安全·系统安全·网络攻击模型·安全架构
段一凡-华北理工大学2 小时前
【高炉炼铁领域炉温监测、预警、调控智能体设计与应用】~系列文章08:多模态数据融合:让数据更聪明
人工智能·python·高炉炼铁·ai赋能·工业智能体·高炉炉温
万粉变现经纪人2 小时前
如何解决 pip install llama-cpp-python 报错 未安装 CMake/Ninja 或 CPU 不支持 AVX 问题
开发语言·python·开源·aigc·pip·ai写作·llama
其实防守也摸鱼3 小时前
CTF密码学综合教学指南--第五章
开发语言·网络·笔记·python·安全·网络安全·密码学
网络工程小王3 小时前
【LangChain 大模型6大调用指南】调用大模型篇
linux·运维·服务器·人工智能·学习