DataWhale—PumpkinBook（TASK07支持向量机）

课程开源地址及相关视频链接：（当然这里也希望大家支持一下正版西瓜书和南瓜书图书，支持文睿、秦州等等致力于开源生态建设的大佬✿✿ヽ(°▽°)ノ✿）

Datawhale-学用 AI,从此开始

【吃瓜教程】《机器学习公式详解》（南瓜书）与西瓜书公式推导_哔哩哔哩_bilibili

支持向量机：https://www.bilibili.com/video/BV1Mh411e7VU?p=9

软间隔与支持向量回归：https://www.bilibili.com/video/BV1Mh411e7VU?p=10

正文部分

支持向量机主要解决二分类 问题，通过学习高维空间的线性分割边界解决原始数据线性不可分问题。

基础的模型输入是原始数据，输出是高维分割超平面，预测时通过某条数据在超平面的哪一侧表达类别归属。

SVM同时也能应用于多分类 、回归及单分类异常检测等问题。

直觉上，线性可分二分类，最好的分类边界应该是使靠的最近的不同类别的数据分开的越远越好。接近边界的数据能被良好地分开，远离边界的数据，分类自然更没问题。
SVM就是尝试寻找这个分割边界，也就是最大化上图中的红色边界和虚线之间的距离，由于是线性关系，系数可以缩放，为方面处理，令m=1，可得最大化的目标函数是1 / ||w||，等价于：

注意：y ϵ {+1, -1}，m=1，不等式约束表达数据都在上图边界构成的管道外，保证w是最优化边界的参数。

考虑不等式约束，根据拉格朗日乘子法，目标函数变为：

拉格朗日对偶问题：

结合KKT条件，最终的目标函数为：

注意最终目标函数的形式：

目标函数的变量是拉格朗日乘子α，且只和数据集(x, y)有关，可以通过SMO(sequential minimal optimization)最优化方法方便求解α。
根据KKT 约束：α_i * g_i(w) = 0，g_i(w) ≤ 0，可知当g_i = 0，α_i > 0，即在上图最近虚线边界上时；当g_i < 0，α_i = 0。
α_i > 0 对应的样本点，称为支持向量，少量的数据参与训练，能有效降低学习的复杂度。
目标函数样本间仅以<内积>形式出现，这是转换为对偶问题后，比较吸引人的形式。
内积形式可以方便地将x打包映射到Φ(x) ，而不影响之前的整个推导，边界关于Φ(x)是线性的；Φ(x)一般是个向量，映射后的空间以向量为基本元素的希尔伯特空间 ，暂且称之为"内积空间"。
内积空间中可以通过核函数技巧，使映射后空间变得更高维复杂，但计算复杂度和原始低维一致。
映射x->Φ(x)的动机来自于低维线性不可分的数据，高维可能可以。