3.判定边界
现在说下决策边界(decision boundary)的概念。这个概念能更好地帮助我们理解逻辑回归的假设函数在计算什么。
在逻辑回归中,我们预测:
当ℎθ (x) >= 0.5时,预测 y = 1。
当ℎθ (x) < 0.5时,预测 y = 0 。
根据上面绘制出的 S 形函数图像,我们知道当
Z = 0 时 g(Z) = 0.5
Z > 0 时 g(Z) > 0.5
Z < 0 时 g(Z) < 0.5 又 Z = θ T x θ^{T}x θTx,
即:
θ T x θ^{T}x θTx >= 0 时,预测 y = 1
θ T x θ^{T}x θTx < 0 时,预测 y = 0
现在假设我们有一个模型:
并且参数θ是向量[-3 1 1] 。 则当−3 + x 1 x_1 x1 + x 2 x_2 x2 ≥ 0,即 x 1 x_1 x1 + x 2 x_2 x2 ≥ 3时,模型将预测 y = 1 。
我们可以绘制直线 x 1 x_1 x1 + x 2 x_2 x2 = 3,这条线便是我们模型的分界线,将预测为1的区域和预测为0的区域分隔开。
假使我们的数据呈现这样的分布情况,怎样的模型才能适合呢?
因为需要用曲线才能分隔 y = 0 的区域和 y = 1 的区域,我们需要二次方特征:
h θ ( x ) = g ( θ 0 + θ 1 x 1 + θ 2 x 2 + θ 3 x + θ 4 x ) h_\theta(x) = g(\theta_0 + \theta_1 x_1 + \theta_2 x_2 + \theta_3 x + \theta_4 x) hθ(x)=g(θ0+θ1x1+θ2x2+θ3x+θ4x)的参数向量为[-1 0 0 1 1],则我们得到的判定边界恰好是圆点在原点且半径为 1 的圆形。
我们可以用非常复杂的模型来适应非常复杂形状的判定边界。