软间隔支持向量机支持向量的情况以及点的各种情况

软间隔支持向量

​ 这一节我们要回答的问题是?如何判断一个点是软间隔支持向量机中的支持向量,在硬间隔支持向量机中,支持向量只需要满足一个等式:
y i ( w T x i + b ) − 1 = 0 y_i(w^Tx_i + b) -1 =0 yi(wTxi+b)−1=0

​ 在软间隔支持向量机中支持向量的定义并没有改变,依旧是距离超平面 1 ∥ ω ∥ \frac{1}{\Vert \omega \Vert} ∥ω∥1的点,但是因为引入的了松弛变量 ζ i \zeta_i ζi,所以我们需要对每一个点进行判断,这里我们判断的依据是KKT条件。
原始可行性: y i ( w T x i + b ) ≥ 1 − ζ i 对偶可行性: α i ≥ 0 μ i ≥ 0 互补松弛条件: α i ( y i ( w T x i + b ) − 1 + ξ i ) = 0 μ i ζ i = 0 C − α i − μ i = 0 原始可行性:y_i(w^Tx_i + b) \geq 1-\zeta_i\\ 对偶可行性:\alpha_i \geq 0 \quad \mu_i \geq 0\\ 互补松弛条件:\alpha_{i}(y_i(w^Tx_i + b) - 1 + \xi_i) = 0 \\\mu_i\zeta_i = 0 \\C -\alpha_i- \mu_i = 0 原始可行性:yi(wTxi+b)≥1−ζi对偶可行性:αi≥0μi≥0互补松弛条件:αi(yi(wTxi+b)−1+ξi)=0μiζi=0C−αi−μi=0

Case1: IF α = 0 \alpha =0 α=0 此时意味着 α i ( y i ( w T x i + b ) − 1 + ξ i ) = 0 \alpha_{i}(y_i(w^Tx_i + b) - 1 + \xi_i) = 0 αi(yi(wTxi+b)−1+ξi)=0恒成立,因为松弛变量 ζ ≥ 0 \zeta \geq 0 ζ≥0,且约束 y i ( w T x i + b ) ≥ 1 − ζ i y_i(w^Tx_i + b) \geq 1-\zeta_i yi(wTxi+b)≥1−ζi,则左边大于右边的最大值也就是: y i ( w T x i + b ) ≥ 1 y_i(w^Tx_i + b) \geq 1 yi(wTxi+b)≥1,此时就代表样本在间隔边界上或者已经被正确分类,对决策边界没有影响,如图中case1点。

​ Case2: IF 0 < α i < C 0 < \alpha_i < C 0<αi<C,当 0 < α i < C 0 < \alpha_i < C 0<αi<C时,由 C − α i − μ i = 0 C - \alpha_i - \mu_i = 0 C−αi−μi=0可得 μ i > 0 \mu_i > 0 μi>0,因为 μ i ( ξ i ) = 0 \mu_i(\xi_i) = 0 μi(ξi)=0(互补松弛条件),所以 ξ i = 0 \xi_i = 0 ξi=0。又因为 α i ( y i ( w ⋅ x i + b ) − 1 + ξ i ) = 0 \alpha_i(y_i(w \cdot x_i + b) - 1 + \xi_i) = 0 αi(yi(w⋅xi+b)−1+ξi)=0且 ξ i = 0 \xi_i = 0 ξi=0,所以 y i ( w ⋅ x i + b ) = 1 y_i(w \cdot x_i + b) = 1 yi(w⋅xi+b)=1。这表明样本点 x i x_i xi位于间隔边界上,是支持向量,对决策边界有影响。如图中点Case2点

​ Case3:IF α = C \alpha =C α=C,当 α i = C \alpha_i = C αi=C时,由 C − α i − μ i = 0 C - \alpha_i - \mu_i = 0 C−αi−μi=0可得 μ i = 0 \mu_i = 0 μi=0,因为 α i ( y i ( w ⋅ x i + b ) − 1 + ξ i ) = 0 \alpha_i(y_i(w \cdot x_i + b) - 1+\xi_i) = 0 αi(yi(w⋅xi+b)−1+ξi)=0且 α i = C > 0 \alpha_i = C > 0 αi=C>0,所以 y i ( w ⋅ x i + b ) − 1 + ξ i = 0 y_i(w \cdot x_i + b) - 1+\xi_i = 0 yi(w⋅xi+b)−1+ξi=0,即 ξ i = 1 − y i ( w ⋅ x i + b ) \xi_i = 1 - y_i(w \cdot x_i + b) ξi=1−yi(w⋅xi+b)。由于 ξ i ≥ 0 \xi_i \geq 0 ξi≥0,所以 y i ( w ⋅ x i + b ) ≤ 1 y_i(w \cdot x_i + b) \leq 1 yi(w⋅xi+b)≤1。这意味着样本点 x i x_i xi可能在间隔内部或者违反间隔边界,有可能是异常点或者对决策边界有较大影响的点。

​ 当 ζ i = 0 时 \zeta_i=0时 ζi=0时, y i ( w ⋅ x i + b ) = 1 y_i(w \cdot x_i + b)=1 yi(w⋅xi+b)=1,样本点位于间隔边界上,是支持向量。

当 0 < ζ i < 1 0<\zeta_i<1 0<ζi<1时,由 ξ i = 1 − y i ( w T x i + b ) \xi_{i} = 1 - y_{i}(w^{T}x_{i}+b) ξi=1−yi(wTxi+b),可得 0 < 1 − y i ( w T x i + b ) < 1 0 < 1 - y_{i}(w^{T}x_{i}+b) < 1 0<1−yi(wTxi+b)<1,即 0 < y i ( w T x i + b ) < 1 0 < y_{i}(w^{T}x_{i}+b) < 1 0<yi(wTxi+b)<1。这意味着样本点 x i x_{i} xi 在间隔内部,但靠近间隔边界。如图中点Case3。

​ 当 ζ i ≥ 1 \zeta_i\geq1 ζi≥1时,可得 1 − y i ( w T x i + b ) ≥ 1 1 - y_{i}(w^{T}x_{i}+b) \geq 1 1−yi(wTxi+b)≥1,即 y i ( w T x i + b ) < 0 y_{i}(w^{T}x_{i}+b) < 0 yi(wTxi+b)<0,此时点在错误的类别区域,可能在负支持向量超平面与超平面的间隔之间,或者直接越过了负支持向量超平面。如图中点Case4,5。

​ 综上如果从松弛变量的值角度来看,当 ζ i = 0 \zeta_i =0 ζi=0时,点要么已经分类好,要么是支持向量,当 0 < ζ < 1 0<\zeta<1 0<ζ<1时,点分类的没问题,但是越过了支持向量平面,当 ζ ≥ 1 \zeta \geq 1 ζ≥1时点没有被分类好,可能在超平面上,可能越过了超平面或者反方向的支持向量平面

相关推荐
pljnb16 分钟前
SVM(支持向量机)
人工智能·机器学习·支持向量机
minji...20 分钟前
C语言 函数递归
c语言·开发语言·算法
你好我是咯咯咯22 分钟前
代码随想录算法训练营Day36
算法
uhakadotcom30 分钟前
如何用AI打造高效招聘系统,HR效率提升100%!
后端·算法·面试
Felven1 小时前
A. Everybody Likes Good Arrays!
数据结构·算法
weixin_430750931 小时前
智能小助手部署 Win10 + ollama的Deepseek + CentOS+ maxKB
linux·人工智能·机器学习·语言模型·自然语言处理·centos
AI_RSER2 小时前
基于 Google Earth Engine 的南京江宁区土地利用分类(K-Means 聚类)
算法·机器学习·分类·kmeans·聚类·遥感·gee
小墙程序员3 小时前
机器学习入门(三)逻辑回归
机器学习
Y1nhl3 小时前
搜广推校招面经八十二
人工智能·pytorch·深度学习·机器学习·推荐算法·搜索算法
全栈派森3 小时前
机器学习第一课: 打通任督二脉
python·机器学习