机器学习（7）逻辑回归及其成本函数

在分类任务中（例如判断肿瘤是良性(0)还是恶性(1) ），如果直接使用线性回归模型：

则预测结果可能超出区间 [0,1]，而概率必须在这个区间内。因此，我们需要一个能够将任意实数映射到 [0,1] 的函数------这就是Sigmoid函数（逻辑函数）。

我们的目标是预测"肿瘤为恶性"的概率。

逻辑回归的核心公式为：

其中：

Sigmoid函数 g(z) 的作用是把线性结果 z 转换为一个范围在 (0,1) 之间的概率值。

例如：

在逻辑回归中，我们通常选择0.5作为分类边界：

线性决策边界对应于一个直线方程，

非线性决策边界可以通过加入多项式特征实现（例如）。

若使用平方误差代价函数：

在逻辑回归中会导致非凸函数（Non-convex），训练时可能陷入局部最小值，优化困难。

为了让优化问题成为凸函数，我们定义单个样本的损失函数（Loss Function）为：

这意味着：

可以把上面的两个情况合并为一个公式：

整个训练集的平均成本函数为：

这个函数是凸函数（bowl shape），可以使用梯度下降高效求得最优解。

假设我们有以下肿瘤数据（单特征）：

我们模型设为：

假设训练得到参数 w=1.5,b=−4.0。

当 x=3 时：

表示"恶性肿瘤"的概率为 62%，因此预测类别为 1（恶性）。

总结：