python学智能算法(三十四)|SVM-KKT条件回顾

【1】引言

前序学习进程中,对软边界拉格朗日方程进行了初步构建。

其中约定了两个拉格朗日乘子要非负,其本质是要满足KKT条件。

今天就乘此次机会,在回顾一下KKT条件。

【2】定义

当问题无约束的时候,只要让函数梯度为零,就可以判定此处有极值点。当有约束存在时,梯度为零条件不再适用。

KKT条件适用的优化问题为:

目标函数最小化, min ⁡ f ( x ) \min f(x) minf(x)

不等式约束: g i ( x ) ≤ 0 ( i = 1 , 2 , . . . , m ) g_{i}(x)\leq 0 (i=1,2,...,m) gi(x)≤0(i=1,2,...,m)

等式约束:h_{j}(x)= 0 (j=1,2,...,p)

其中, x ∈ R n x\in R^n x∈Rn是自变量, f , g i , h j f,g_{i},h_{j} f,gi,hj均为连续可微函数。

如果 x ∗ x* x∗是局部最优解,且满足约束规范,比如Slater条件,则存在拉格朗日乘子 λ i ≥ 0 , μ \lambda_{i}\geq 0,\mu λi≥0,μ分别对应 g i , h j g_{i},h_{j} gi,hj,使得以下条件同时成立。

首先是目标函数与约束函数的梯度通过乘子线性组合为零,也就是梯度平衡
∇ f ( x ∗ ) + ∑ i = 1 m λ i ∇ g i ( x ∗ ) + ∑ j = 1 p μ j ∇ h j ( x ∗ ) = 0 \nabla f(x^{*})+\sum_{i=1}^{m}\lambda_{i}\nabla g_{i}(x^{*})+\sum_{j=1}^{p}\mu_{j}\nabla h_{j}(x^{*})=0 ∇f(x∗)+i=1∑mλi∇gi(x∗)+j=1∑pμj∇hj(x∗)=0

需要说明的是,不等式约束乘子非负,且满足 λ i ⋅ g i ( x ∗ ) = 0 ( i = 1 , 2 , . . . , m ) \lambda_{i}\cdot g_{i}(x^{*})=0(i=1,2,...,m) λi⋅gi(x∗)=0(i=1,2,...,m)

上述公式在 x ∗ x^* x∗是最优解时一定满足。

当 g i ( x ∗ ) < 0 g_{i}(x^{*})<0 gi(x∗)<0时,实际上就在不等式约束内部,相当于无用约束,此时 λ i = 0 \lambda_{i}=0 λi=0,所以 λ i ⋅ g i ( x ∗ ) = 0 \lambda_{i} \cdot g_{i}(x^{*})=0 λi⋅gi(x∗)=0;

当 g i ( x ∗ ) = 0 g_{i}(x^{*})=0 gi(x∗)=0时,此时来到了不等式约束边缘,为了实现取极值,一定会满足梯度平衡,可参考拉格朗日乘数法加深理解,此时必有: ∇ f ( x ∗ ) + ∑ i = 1 m λ i ∇ g i ( x ∗ ) = 0 \nabla f(x^{*})+\sum_{i=1}^{m}\lambda_{i}\nabla g_{i}(x^{*})=0 ∇f(x∗)+i=1∑mλi∇gi(x∗)=0因为 g i ( x ∗ ) = 0 g_{i}(x^{*})=0 gi(x∗)=0所以 λ i ⋅ g i ( x ∗ ) = 0 \lambda_{i}\cdot g_{i}(x^{*})=0 λi⋅gi(x∗)=0。

下图可做辅助理解。

【3】总结

回顾了KKT条件的基本定义内容。

相关推荐
tsumikistep8 分钟前
【前后端】接口文档与导入
前端·后端·python·硬件架构
小毅&Nora17 分钟前
【人工智能】【AI外呼】系统架构设计与实现详解
人工智能·系统架构·ai外呼
小白学大数据41 分钟前
Python爬虫伪装策略:如何模拟浏览器正常访问JSP站点
java·开发语言·爬虫·python
一只侯子1 小时前
Face AE Tuning
图像处理·笔记·学习·算法·计算机视觉
jianqiang.xue1 小时前
别把 Scratch 当 “动画玩具”!图形化编程是算法思维的最佳启蒙
人工智能·算法·青少年编程·机器人·少儿编程
SEO_juper1 小时前
别再纠结LLMs.txt了!它背后的真相与最佳使用场景,一文讲透。
开发语言·ai·php·数字营销
g***B7382 小时前
JavaScript在Node.js中的模块系统
开发语言·javascript·node.js
不许哈哈哈2 小时前
Python数据结构
数据结构·算法·排序算法
烤麻辣烫2 小时前
黑马程序员大事件后端概览(表现效果升级版)
java·开发语言·学习·spring·intellij-idea
Coding茶水间2 小时前
基于深度学习的安全帽检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
图像处理·人工智能·深度学习·yolo·目标检测·计算机视觉