软间隔支持向量机支持向量的情况以及点的各种情况

软间隔支持向量

这一节我们要回答的问题是？如何判断一个点是软间隔支持向量机中的支持向量，在硬间隔支持向量机中，支持向量只需要满足一个等式：
y i ( w T x i + b ) − 1 = 0 y_i(w^Tx_i + b) -1 =0 yi(wTxi+b)−1=0

在软间隔支持向量机中支持向量的定义并没有改变，依旧是距离超平面 1 ∥ ω ∥ \frac{1}{\Vert \omega \Vert} ∥ω∥1的点，但是因为引入的了松弛变量 ζ i \zeta_i ζi，所以我们需要对每一个点进行判断，这里我们判断的依据是KKT条件。
原始可行性： y i ( w T x i + b ) ≥ 1 − ζ i 对偶可行性： α i ≥ 0 μ i ≥ 0 互补松弛条件： α i ( y i ( w T x i + b ) − 1 + ξ i ) = 0 μ i ζ i = 0 C − α i − μ i = 0 原始可行性：y_i(w^Tx_i + b) \geq 1-\zeta_i\\ 对偶可行性：\alpha_i \geq 0 \quad \mu_i \geq 0\\ 互补松弛条件：\alpha_{i}(y_i(w^Tx_i + b) - 1 + \xi_i) = 0 \\\mu_i\zeta_i = 0 \\C -\alpha_i- \mu_i = 0 原始可行性：yi(wTxi+b)≥1−ζi对偶可行性：αi≥0μi≥0互补松弛条件：αi(yi(wTxi+b)−1+ξi)=0μiζi=0C−αi−μi=0

Case1: IF α = 0 \alpha =0 α=0 此时意味着 α i ( y i ( w T x i + b ) − 1 + ξ i ) = 0 \alpha_{i}(y_i(w^Tx_i + b) - 1 + \xi_i) = 0 αi(yi(wTxi+b)−1+ξi)=0恒成立，因为松弛变量 ζ ≥ 0 \zeta \geq 0 ζ≥0,且约束 y i ( w T x i + b ) ≥ 1 − ζ i y_i(w^Tx_i + b) \geq 1-\zeta_i yi(wTxi+b)≥1−ζi，则左边大于右边的最大值也就是： y i ( w T x i + b ) ≥ 1 y_i(w^Tx_i + b) \geq 1 yi(wTxi+b)≥1，此时就代表样本在间隔边界上或者已经被正确分类，对决策边界没有影响，如图中case1点。

Case2: IF 0 < α i < C 0 < \alpha_i < C 0<αi<C，当 0 < α i < C 0 < \alpha_i < C 0<αi<C时，由 C − α i − μ i = 0 C - \alpha_i - \mu_i = 0 C−αi−μi=0可得 μ i > 0 \mu_i > 0 μi>0，因为 μ i ( ξ i ) = 0 \mu_i(\xi_i) = 0 μi(ξi)=0（互补松弛条件），所以 ξ i = 0 \xi_i = 0 ξi=0。又因为 α i ( y i ( w ⋅ x i + b ) − 1 + ξ i ) = 0 \alpha_i(y_i(w \cdot x_i + b) - 1 + \xi_i) = 0 αi(yi(w⋅xi+b)−1+ξi)=0且 ξ i = 0 \xi_i = 0 ξi=0，所以 y i ( w ⋅ x i + b ) = 1 y_i(w \cdot x_i + b) = 1 yi(w⋅xi+b)=1。这表明样本点 x i x_i xi位于间隔边界上，是支持向量，对决策边界有影响。如图中点Case2点

Case3：IF α = C \alpha =C α=C,当 α i = C \alpha_i = C αi=C时，由 C − α i − μ i = 0 C - \alpha_i - \mu_i = 0 C−αi−μi=0可得 μ i = 0 \mu_i = 0 μi=0，因为 α i ( y i ( w ⋅ x i + b ) − 1 + ξ i ) = 0 \alpha_i(y_i(w \cdot x_i + b) - 1+\xi_i) = 0 αi(yi(w⋅xi+b)−1+ξi)=0且 α i = C > 0 \alpha_i = C > 0 αi=C>0，所以 y i ( w ⋅ x i + b ) − 1 + ξ i = 0 y_i(w \cdot x_i + b) - 1+\xi_i = 0 yi(w⋅xi+b)−1+ξi=0，即 ξ i = 1 − y i ( w ⋅ x i + b ) \xi_i = 1 - y_i(w \cdot x_i + b) ξi=1−yi(w⋅xi+b)。由于 ξ i ≥ 0 \xi_i \geq 0 ξi≥0，所以 y i ( w ⋅ x i + b ) ≤ 1 y_i(w \cdot x_i + b) \leq 1 yi(w⋅xi+b)≤1。这意味着样本点 x i x_i xi可能在间隔内部或者违反间隔边界，有可能是异常点或者对决策边界有较大影响的点。

当 ζ i = 0 时 \zeta_i=0时 ζi=0时， y i ( w ⋅ x i + b ) = 1 y_i(w \cdot x_i + b)=1 yi(w⋅xi+b)=1，样本点位于间隔边界上，是支持向量。

当 0 < ζ i < 1 0<\zeta_i<1 0<ζi<1时,由 ξ i = 1 − y i ( w T x i + b ) \xi_{i} = 1 - y_{i}(w^{T}x_{i}+b) ξi=1−yi(wTxi+b)，可得 0 < 1 − y i ( w T x i + b ) < 1 0 < 1 - y_{i}(w^{T}x_{i}+b) < 1 0<1−yi(wTxi+b)<1，即 0 < y i ( w T x i + b ) < 1 0 < y_{i}(w^{T}x_{i}+b) < 1 0<yi(wTxi+b)<1。这意味着样本点 x i x_{i} xi 在间隔内部，但靠近间隔边界。如图中点Case3。

当 ζ i ≥ 1 \zeta_i\geq1 ζi≥1时，可得 1 − y i ( w T x i + b ) ≥ 1 1 - y_{i}(w^{T}x_{i}+b) \geq 1 1−yi(wTxi+b)≥1，即 y i ( w T x i + b ) < 0 y_{i}(w^{T}x_{i}+b) < 0 yi(wTxi+b)<0，此时点在错误的类别区域，可能在负支持向量超平面与超平面的间隔之间，或者直接越过了负支持向量超平面。如图中点Case4，5。

综上如果从松弛变量的值角度来看，当 ζ i = 0 \zeta_i =0 ζi=0时，点要么已经分类好，要么是支持向量，当 0 < ζ < 1 0<\zeta<1 0<ζ<1时，点分类的没问题，但是越过了支持向量平面，当 ζ ≥ 1 \zeta \geq 1 ζ≥1时点没有被分类好，可能在超平面上，可能越过了超平面或者反方向的支持向量平面