软间隔支持向量机支持向量的情况以及点的各种情况

软间隔支持向量

​ 这一节我们要回答的问题是?如何判断一个点是软间隔支持向量机中的支持向量,在硬间隔支持向量机中,支持向量只需要满足一个等式:
y i ( w T x i + b ) − 1 = 0 y_i(w^Tx_i + b) -1 =0 yi(wTxi+b)−1=0

​ 在软间隔支持向量机中支持向量的定义并没有改变,依旧是距离超平面 1 ∥ ω ∥ \frac{1}{\Vert \omega \Vert} ∥ω∥1的点,但是因为引入的了松弛变量 ζ i \zeta_i ζi,所以我们需要对每一个点进行判断,这里我们判断的依据是KKT条件。
原始可行性: y i ( w T x i + b ) ≥ 1 − ζ i 对偶可行性: α i ≥ 0 μ i ≥ 0 互补松弛条件: α i ( y i ( w T x i + b ) − 1 + ξ i ) = 0 μ i ζ i = 0 C − α i − μ i = 0 原始可行性:y_i(w^Tx_i + b) \geq 1-\zeta_i\\ 对偶可行性:\alpha_i \geq 0 \quad \mu_i \geq 0\\ 互补松弛条件:\alpha_{i}(y_i(w^Tx_i + b) - 1 + \xi_i) = 0 \\\mu_i\zeta_i = 0 \\C -\alpha_i- \mu_i = 0 原始可行性:yi(wTxi+b)≥1−ζi对偶可行性:αi≥0μi≥0互补松弛条件:αi(yi(wTxi+b)−1+ξi)=0μiζi=0C−αi−μi=0

Case1: IF α = 0 \alpha =0 α=0 此时意味着 α i ( y i ( w T x i + b ) − 1 + ξ i ) = 0 \alpha_{i}(y_i(w^Tx_i + b) - 1 + \xi_i) = 0 αi(yi(wTxi+b)−1+ξi)=0恒成立,因为松弛变量 ζ ≥ 0 \zeta \geq 0 ζ≥0,且约束 y i ( w T x i + b ) ≥ 1 − ζ i y_i(w^Tx_i + b) \geq 1-\zeta_i yi(wTxi+b)≥1−ζi,则左边大于右边的最大值也就是: y i ( w T x i + b ) ≥ 1 y_i(w^Tx_i + b) \geq 1 yi(wTxi+b)≥1,此时就代表样本在间隔边界上或者已经被正确分类,对决策边界没有影响,如图中case1点。

​ Case2: IF 0 < α i < C 0 < \alpha_i < C 0<αi<C,当 0 < α i < C 0 < \alpha_i < C 0<αi<C时,由 C − α i − μ i = 0 C - \alpha_i - \mu_i = 0 C−αi−μi=0可得 μ i > 0 \mu_i > 0 μi>0,因为 μ i ( ξ i ) = 0 \mu_i(\xi_i) = 0 μi(ξi)=0(互补松弛条件),所以 ξ i = 0 \xi_i = 0 ξi=0。又因为 α i ( y i ( w ⋅ x i + b ) − 1 + ξ i ) = 0 \alpha_i(y_i(w \cdot x_i + b) - 1 + \xi_i) = 0 αi(yi(w⋅xi+b)−1+ξi)=0且 ξ i = 0 \xi_i = 0 ξi=0,所以 y i ( w ⋅ x i + b ) = 1 y_i(w \cdot x_i + b) = 1 yi(w⋅xi+b)=1。这表明样本点 x i x_i xi位于间隔边界上,是支持向量,对决策边界有影响。如图中点Case2点

​ Case3:IF α = C \alpha =C α=C,当 α i = C \alpha_i = C αi=C时,由 C − α i − μ i = 0 C - \alpha_i - \mu_i = 0 C−αi−μi=0可得 μ i = 0 \mu_i = 0 μi=0,因为 α i ( y i ( w ⋅ x i + b ) − 1 + ξ i ) = 0 \alpha_i(y_i(w \cdot x_i + b) - 1+\xi_i) = 0 αi(yi(w⋅xi+b)−1+ξi)=0且 α i = C > 0 \alpha_i = C > 0 αi=C>0,所以 y i ( w ⋅ x i + b ) − 1 + ξ i = 0 y_i(w \cdot x_i + b) - 1+\xi_i = 0 yi(w⋅xi+b)−1+ξi=0,即 ξ i = 1 − y i ( w ⋅ x i + b ) \xi_i = 1 - y_i(w \cdot x_i + b) ξi=1−yi(w⋅xi+b)。由于 ξ i ≥ 0 \xi_i \geq 0 ξi≥0,所以 y i ( w ⋅ x i + b ) ≤ 1 y_i(w \cdot x_i + b) \leq 1 yi(w⋅xi+b)≤1。这意味着样本点 x i x_i xi可能在间隔内部或者违反间隔边界,有可能是异常点或者对决策边界有较大影响的点。

​ 当 ζ i = 0 时 \zeta_i=0时 ζi=0时, y i ( w ⋅ x i + b ) = 1 y_i(w \cdot x_i + b)=1 yi(w⋅xi+b)=1,样本点位于间隔边界上,是支持向量。

当 0 < ζ i < 1 0<\zeta_i<1 0<ζi<1时,由 ξ i = 1 − y i ( w T x i + b ) \xi_{i} = 1 - y_{i}(w^{T}x_{i}+b) ξi=1−yi(wTxi+b),可得 0 < 1 − y i ( w T x i + b ) < 1 0 < 1 - y_{i}(w^{T}x_{i}+b) < 1 0<1−yi(wTxi+b)<1,即 0 < y i ( w T x i + b ) < 1 0 < y_{i}(w^{T}x_{i}+b) < 1 0<yi(wTxi+b)<1。这意味着样本点 x i x_{i} xi 在间隔内部,但靠近间隔边界。如图中点Case3。

​ 当 ζ i ≥ 1 \zeta_i\geq1 ζi≥1时,可得 1 − y i ( w T x i + b ) ≥ 1 1 - y_{i}(w^{T}x_{i}+b) \geq 1 1−yi(wTxi+b)≥1,即 y i ( w T x i + b ) < 0 y_{i}(w^{T}x_{i}+b) < 0 yi(wTxi+b)<0,此时点在错误的类别区域,可能在负支持向量超平面与超平面的间隔之间,或者直接越过了负支持向量超平面。如图中点Case4,5。

​ 综上如果从松弛变量的值角度来看,当 ζ i = 0 \zeta_i =0 ζi=0时,点要么已经分类好,要么是支持向量,当 0 < ζ < 1 0<\zeta<1 0<ζ<1时,点分类的没问题,但是越过了支持向量平面,当 ζ ≥ 1 \zeta \geq 1 ζ≥1时点没有被分类好,可能在超平面上,可能越过了超平面或者反方向的支持向量平面

相关推荐
CoovallyAIHub6 小时前
中科大DSAI Lab团队多篇论文入选ICCV 2025,推动三维视觉与泛化感知技术突破
深度学习·算法·计算机视觉
NAGNIP7 小时前
Serverless 架构下的大模型框架落地实践
算法·架构
moonlifesudo7 小时前
半开区间和开区间的两个二分模版
算法
moonlifesudo7 小时前
300:最长递增子序列
算法
CoovallyAIHub12 小时前
港大&字节重磅发布DanceGRPO:突破视觉生成RLHF瓶颈,多项任务性能提升超180%!
深度学习·算法·计算机视觉
CoovallyAIHub13 小时前
英伟达ViPE重磅发布!解决3D感知难题,SLAM+深度学习完美融合(附带数据集下载地址)
深度学习·算法·计算机视觉
聚客AI1 天前
🙋‍♀️Transformer训练与推理全流程:从输入处理到输出生成
人工智能·算法·llm
大怪v1 天前
前端:人工智能?我也会啊!来个花活,😎😎😎“自动驾驶”整起!
前端·javascript·算法
惯导马工1 天前
【论文导读】ORB-SLAM3:An Accurate Open-Source Library for Visual, Visual-Inertial and
深度学习·算法
骑自行车的码农1 天前
【React用到的一些算法】游标和栈
算法·react.js