一、损失函数介绍:
- 与回归问题成本函数不同的是 ,逻辑回归模型(解决分类问题)的成本函数在获得损失J的时候不再用真实值y与预测值y^的差值计算损失,真实值y不再出现在公式中作为计算项 。
- 首先,该次训练损失为训练集中所有样本损失求和取平均值。
- 其次,上述损失函数如何在不计算真实值与预测值的差值的情况下获得训练损失? 解释如下:
-
对于第一个函数:样本标签的真实值为1时适用的损失函数
- 图像中横坐标为预测值y^,纵坐标为损失
- 可以看到预测值越接近1,即分类越接近正确,损失越小(因为真实值为1);预测值越接近0,即分类越离谱,损失越大(因为真实值为1)。****【这就非常神奇地在不计算真实值与预测值的差值的情况下获得了训练损失】
-
对于第二个函数:样本标签的真实值为0时适用的损失函数
- 图像中横坐标为预测值y^,纵坐标为损失
- 可以看到预测值越接近0,即分类越接近正确,损失越小(因为真实值为0);预测值越接近1,即分类越离谱,损失越大(因为真实值为0)。【这就非常神奇地在不计算真实值与预测值的差值的情况下获得了训练损失】
-
二、简化损失函数:
我们可以将分段函数L进行简化:
得到最终的损失函数: