软间隔支持向量机支持向量的情况以及点的各种情况

软间隔支持向量

​ 这一节我们要回答的问题是?如何判断一个点是软间隔支持向量机中的支持向量,在硬间隔支持向量机中,支持向量只需要满足一个等式:
y i ( w T x i + b ) − 1 = 0 y_i(w^Tx_i + b) -1 =0 yi(wTxi+b)−1=0

​ 在软间隔支持向量机中支持向量的定义并没有改变,依旧是距离超平面 1 ∥ ω ∥ \frac{1}{\Vert \omega \Vert} ∥ω∥1的点,但是因为引入的了松弛变量 ζ i \zeta_i ζi,所以我们需要对每一个点进行判断,这里我们判断的依据是KKT条件。
原始可行性: y i ( w T x i + b ) ≥ 1 − ζ i 对偶可行性: α i ≥ 0 μ i ≥ 0 互补松弛条件: α i ( y i ( w T x i + b ) − 1 + ξ i ) = 0 μ i ζ i = 0 C − α i − μ i = 0 原始可行性:y_i(w^Tx_i + b) \geq 1-\zeta_i\\ 对偶可行性:\alpha_i \geq 0 \quad \mu_i \geq 0\\ 互补松弛条件:\alpha_{i}(y_i(w^Tx_i + b) - 1 + \xi_i) = 0 \\\mu_i\zeta_i = 0 \\C -\alpha_i- \mu_i = 0 原始可行性:yi(wTxi+b)≥1−ζi对偶可行性:αi≥0μi≥0互补松弛条件:αi(yi(wTxi+b)−1+ξi)=0μiζi=0C−αi−μi=0

Case1: IF α = 0 \alpha =0 α=0 此时意味着 α i ( y i ( w T x i + b ) − 1 + ξ i ) = 0 \alpha_{i}(y_i(w^Tx_i + b) - 1 + \xi_i) = 0 αi(yi(wTxi+b)−1+ξi)=0恒成立,因为松弛变量 ζ ≥ 0 \zeta \geq 0 ζ≥0,且约束 y i ( w T x i + b ) ≥ 1 − ζ i y_i(w^Tx_i + b) \geq 1-\zeta_i yi(wTxi+b)≥1−ζi,则左边大于右边的最大值也就是: y i ( w T x i + b ) ≥ 1 y_i(w^Tx_i + b) \geq 1 yi(wTxi+b)≥1,此时就代表样本在间隔边界上或者已经被正确分类,对决策边界没有影响,如图中case1点。

​ Case2: IF 0 < α i < C 0 < \alpha_i < C 0<αi<C,当 0 < α i < C 0 < \alpha_i < C 0<αi<C时,由 C − α i − μ i = 0 C - \alpha_i - \mu_i = 0 C−αi−μi=0可得 μ i > 0 \mu_i > 0 μi>0,因为 μ i ( ξ i ) = 0 \mu_i(\xi_i) = 0 μi(ξi)=0(互补松弛条件),所以 ξ i = 0 \xi_i = 0 ξi=0。又因为 α i ( y i ( w ⋅ x i + b ) − 1 + ξ i ) = 0 \alpha_i(y_i(w \cdot x_i + b) - 1 + \xi_i) = 0 αi(yi(w⋅xi+b)−1+ξi)=0且 ξ i = 0 \xi_i = 0 ξi=0,所以 y i ( w ⋅ x i + b ) = 1 y_i(w \cdot x_i + b) = 1 yi(w⋅xi+b)=1。这表明样本点 x i x_i xi位于间隔边界上,是支持向量,对决策边界有影响。如图中点Case2点

​ Case3:IF α = C \alpha =C α=C,当 α i = C \alpha_i = C αi=C时,由 C − α i − μ i = 0 C - \alpha_i - \mu_i = 0 C−αi−μi=0可得 μ i = 0 \mu_i = 0 μi=0,因为 α i ( y i ( w ⋅ x i + b ) − 1 + ξ i ) = 0 \alpha_i(y_i(w \cdot x_i + b) - 1+\xi_i) = 0 αi(yi(w⋅xi+b)−1+ξi)=0且 α i = C > 0 \alpha_i = C > 0 αi=C>0,所以 y i ( w ⋅ x i + b ) − 1 + ξ i = 0 y_i(w \cdot x_i + b) - 1+\xi_i = 0 yi(w⋅xi+b)−1+ξi=0,即 ξ i = 1 − y i ( w ⋅ x i + b ) \xi_i = 1 - y_i(w \cdot x_i + b) ξi=1−yi(w⋅xi+b)。由于 ξ i ≥ 0 \xi_i \geq 0 ξi≥0,所以 y i ( w ⋅ x i + b ) ≤ 1 y_i(w \cdot x_i + b) \leq 1 yi(w⋅xi+b)≤1。这意味着样本点 x i x_i xi可能在间隔内部或者违反间隔边界,有可能是异常点或者对决策边界有较大影响的点。

​ 当 ζ i = 0 时 \zeta_i=0时 ζi=0时, y i ( w ⋅ x i + b ) = 1 y_i(w \cdot x_i + b)=1 yi(w⋅xi+b)=1,样本点位于间隔边界上,是支持向量。

当 0 < ζ i < 1 0<\zeta_i<1 0<ζi<1时,由 ξ i = 1 − y i ( w T x i + b ) \xi_{i} = 1 - y_{i}(w^{T}x_{i}+b) ξi=1−yi(wTxi+b),可得 0 < 1 − y i ( w T x i + b ) < 1 0 < 1 - y_{i}(w^{T}x_{i}+b) < 1 0<1−yi(wTxi+b)<1,即 0 < y i ( w T x i + b ) < 1 0 < y_{i}(w^{T}x_{i}+b) < 1 0<yi(wTxi+b)<1。这意味着样本点 x i x_{i} xi 在间隔内部,但靠近间隔边界。如图中点Case3。

​ 当 ζ i ≥ 1 \zeta_i\geq1 ζi≥1时,可得 1 − y i ( w T x i + b ) ≥ 1 1 - y_{i}(w^{T}x_{i}+b) \geq 1 1−yi(wTxi+b)≥1,即 y i ( w T x i + b ) < 0 y_{i}(w^{T}x_{i}+b) < 0 yi(wTxi+b)<0,此时点在错误的类别区域,可能在负支持向量超平面与超平面的间隔之间,或者直接越过了负支持向量超平面。如图中点Case4,5。

​ 综上如果从松弛变量的值角度来看,当 ζ i = 0 \zeta_i =0 ζi=0时,点要么已经分类好,要么是支持向量,当 0 < ζ < 1 0<\zeta<1 0<ζ<1时,点分类的没问题,但是越过了支持向量平面,当 ζ ≥ 1 \zeta \geq 1 ζ≥1时点没有被分类好,可能在超平面上,可能越过了超平面或者反方向的支持向量平面

相关推荐
AICodeThunder1 小时前
C++知识点总结(57):STL综合
java·c++·算法
薔薇十字1 小时前
【代码随想录day32】【C++复健】509. 斐波那契数;70. 爬楼梯;746. 使用最小花费爬楼梯
开发语言·c++·算法
White graces1 小时前
力扣(LeetCode)283. 移动零(Java)
算法·leetcode
秀儿还能再秀1 小时前
机器学习: LightGBM模型(优化版)——高效且强大的树形模型
决策树·机器学习·gbdt·lightbmg
液态不合群1 小时前
Rust字符串类型全解析
网络·算法·rust
智能汽车人1 小时前
自动驾驶---行泊一体(车位到车位功能)量产
人工智能·机器学习·华为·自动驾驶
理论最高的吻1 小时前
222. 完全二叉树的节点个数【 力扣(LeetCode) 】
c++·算法·leetcode·职场和发展·二叉树
旧日之血_Hayter1 小时前
LeetCode105.从前序与中序遍历构造二叉树
算法·leetcode
Fms_Sa2 小时前
假设一棵平衡二叉树的每个结点都表明了平衡因子b,试设计一个算法,求平衡二叉树的高度。
c语言·数据结构·算法
yangmc042 小时前
区间和 离散化 模板题
c语言·数据结构·c++·算法·矩阵·objective-c