AI理论知识系统复习(1):交叉熵损失函数

目录

[1 什么是交叉熵损失函数](#1 什么是交叉熵损失函数)

[2 疑问:为什么要乘以负一](#2 疑问:为什么要乘以负一)


bastract:

交叉熵损失函数就是-ln(真实类别的预测概率)

1 什么是交叉熵损失函数

在看transformer的时候遇到了这个,稍微写一下笔记,

这里面

  • softmax 得到预测概率分布 pred_prob

  • one-hot 表示真实分布 target_prob

这里真实分布target_prob里面,除了该类别的位置是1以外,其他位置都是0,那么乘以0的就都没了,所以这个公式其实就是

比如

类别 概率
27 0.8
128 0.1
311 0.1

2 疑问:为什么要乘以负一

因为 log(x) 的值永远 ≤ 0(当 x 在 0~1 区间时):

  • log(1) = 0

  • log(0.8) ≈ -0.22

  • log(0.01) = -4.6

  • log(0.000001) = -13.8

损失(loss)必须是 "越小越好" 的非负数

但是 log(prob) 会产生负数,怎么办?

👉 乘上 -1,把负数变成正数,同时保持"概率越大损失越小"的性质"。

相关推荐
Yngz_Miao9 天前
【深度学习】语义分割损失函数之SemScal Loss
人工智能·深度学习·语义分割·损失函数·semscalloss
劈星斩月11 天前
3Blue1Brown-深度学习之梯度下降法
深度学习·损失函数·梯度下降
Yngz_Miao12 天前
【深度学习】交叉熵损失函数Cross-Entropy Loss
人工智能·深度学习·损失函数·交叉熵·ce
Yngz_Miao12 天前
【深度学习】动态交叉熵损失函数Focal Loss
人工智能·深度学习·损失函数·focalloss·动态交叉熵
deephub13 天前
RAG 检索模型如何学习:三种损失函数的机制解析
人工智能·深度学习·损失函数·信息检索·rag
Pyeako14 天前
深度学习--BP神经网络&梯度下降&损失函数
人工智能·python·深度学习·bp神经网络·损失函数·梯度下降·正则化惩罚
QiZhang | UESTC22 天前
【豆包写的】二分类交叉熵损失函数(BCE Loss)详细推导
机器学习·损失函数·分类任务
一瞬祈望1 个月前
⭐ 深度学习入门体系(第 7 篇): 什么是损失函数?
人工智能·深度学习·cnn·损失函数
最晚的py2 个月前
正规方程法
损失函数·正规方程法
最晚的py2 个月前
机器学习--损失函数
人工智能·python·机器学习·损失函数