交叉熵

a man of sadness

决策树算法基础：信息熵相关知识本文对信息熵等概念进行系统梳理，为后续学习决策树系列算法做好准备挖坑待填：ID3、C4.5、CART、随机森林、LightGBM

码字的字节

深度学习损失函数的设计哲学：从交叉熵到Huber损失的深入探索在深度学习的训练过程中，损失函数扮演着指挥棒的角色，它量化了模型预测与真实值之间的差异，为优化算法提供了明确的改进方向。理解损失函数的设计哲学，是构建高效深度学习模型的关键一步。

激活层为softmax时，CrossEntropy损失函数对激活层输入Z的梯度∂ L ∂ Z = y ^ − y \frac{\partial L}{\partial Z}=\hat{y}-y ∂Z∂L=y^−y 其中 y y y为真实值，采用one-hot编码， y ^ \hat{y} y^为softmax输出的预测值

从对数变换到深度框架：逻辑回归与交叉熵的数学原理及PyTorch实战目录书接上文深度学习激活函数与损失函数全解析：从Sigmoid到交叉熵的数学原理与实践应用-CSDN博客文章浏览阅读254次，点赞10次，收藏8次。本文系统探讨了Sigmoid、tanh、ReLU、Leaky ReLU、PReLU、ELU等激活函数的数学公式、导数特性、优劣势及适用场景，并通过Python代码实现可视化分析。同时深入对比了极大似然估计与交叉熵损失函数的差异，阐述其在分类任务中的核心作用，揭示MSE在分类问题中的局限性及交叉熵的理论优势。https://blog.csdn.net/qq_58

交叉熵在机器学习中的应用解析交叉熵（Cross-Entropy）是信息论和机器学习中的一个重要概念，用于衡量两个概率分布之间的差异。它在分类任务（如逻辑回归、神经网络）中常作为损失函数使用。

xidianjiapei001

一文读懂深度学习中的损失函数quantifying loss —— 作用、分类和示例代码在深度学习中，quantifying loss（量化损失）是指通过数学方法计算模型预测值与真实值之间的差异，以衡量模型的性能。损失函数（Loss Function）是量化损失的核心工具，它定义了模型预测值与真实值之间的误差大小。损失值越小，表示模型的预测越接近真实值。

【深度学习】交叉熵：从理论到实践在深度学习的广阔领域中，损失函数是模型训练的核心驱动力。而交叉熵作为其中的重要一员，扮演着不可或缺的角色。无论是图像分类、自然语言处理还是语音识别，交叉熵都在默默地推动着模型的优化与进步。本文将带你深入理解交叉熵的原理、应用场景以及如何在实际项目中灵活运用它。通过代码示例、实际案例和可视化图表，我们将一步步揭开交叉熵的神秘面纱。

20240621日志：大模型压缩-从闭源大模型蒸馏location：beijing 涉及知识：大模型压缩、知识蒸馏本文提出在一个贝叶斯估计框架内估计闭源语言模型的输出分布，包括先验估计和后验估计。先验估计的目的是通过闭源模型生成的语料库（可能包含模型的粗粒度信息）得到先验分布；后验估计使用代理模型来更新先验分布并生成后验分布。利用这两个分布来进行知识蒸馏。

西西弗Sisyphus

深入理解交叉熵损失CrossEntropyLoss - 信息论（交叉熵）其中， P ( x ) P(x) P(x) 是事件 x x x 发生的概率，通常以2为底数（即比特）。事件越不可能发生，其自信息量越大。

python自定义交叉熵损失，再和pytorch api对比我们知道，交叉熵本质上是两个概率分布之间差异的度量，公式如下其中概率分布P是基准，我们知道H(P,Q)>=0，那么H(P,Q)越小，说明Q约接近P。

二元交叉熵损失函数（Binary Cross Entropy Loss，BCELoss）是交叉熵损失函数（CrossEntropyLoss）的特殊情况一直以来看到二元交叉熵损失函数（Binary Cross Entropy Loss，BCELoss）还以为是很复杂的东西，原来其实是交叉熵损失函数（CrossEntropyLoss）的特殊情况，也就是二元交叉熵损失函数其实就是交叉熵损失函数。

一篇文章彻底搞懂熵、信息熵、KL散度、交叉熵、Softmax和交叉熵损失函数1. 熵是一个物理学概念，它表示一个系统的不确定性程度，或者说是一个系统的混乱程度。2. 信息熵：一个叫香农的美国数学家将熵引入信息论中，用来衡量信息的不确定性，并将它命名为 “香农熵” 或者 “信息熵”。

我是有底线的