模式识别与机器学习 | 第七章 支持向量机

线性支持向量机/核支持向量机

间隔

分类器的置信度:

  • 概率 越大,y=1概率越大
  • 点到分离超平面H的距离反映了置信度

函数间隔:样本,它到**(w,b)确定的超平面** 的函数间隔

****模型对样本的预测正确

大的函数间隔->确信正确的预测

训练数据集的函数间隔,所有样本里最小的那个

几何间隔:

点到决策界面(直线wx+b=0)的距离

最优间隔分类器:间隔最大化

线性SVM(原始)

输入:数据集S

输出:判别函数

判别届面/分离超平面

参数w,b通过解决最优化间隔分类器问题

其中 支持向量 线性可分情况下,至少有两个不同类别的点在边界上

函数间隔

几何间隔

间隔

拉格朗日

约束条件

广义拉格朗日函数 (求解偏导为0)

拉格朗日对偶(原问题与对偶问题):

原问题为凸函数时,严格满足,可取"="

满足Karush-Kuhn-Tucker(KKT)条件:

kkT对偶互补性

最有间隔分类器 : 对偶解

利用KKT对偶互补性条件

支持向量的数量远小于训练样本的数目!

  • 固定α,有关于参数w,b最小化L得到

最大化θ,得到对偶问题最优解 d*

拉格朗日函数

求解w,b: 对w求偏导:

对b求偏导:

带入拉格朗日函数:

线性SVM(对偶)

输入:数据集S

输出:判别函数

判别届面/分离超平面

  • 通过求解对偶问题得到最优解α*
  • 得到原问题最优解w*,b*
软间隔

存在线性不可分的情况(有离群点或者噪声样本)但整体大部分仍可分

Hinge损失:

引入松驰变量ξ

  • 软间隔对偶问题

拉格朗日函数

固定α、η,求w,b,ξ,最小化L(求偏导,偏导为0),得到

最大化θ,得到最优值d*、η,

ps. C表示惩罚程度:C较大惩罚重;小则惩罚松,可以容忍分错

非线性可分SVM(对偶问题)

输入:数据集S

输出:判别函数,分类超平面

  • 选择参数C,通过求解对偶问题,得到最优解α*
  • 得到原问题最优解w*,b*
  • 判别函数

分离超平面

非线性SVM-核函数

利用核函数,将低维->高维,非线性变成线性可分

  • 非线性变换 ,将原来线性SVM问题中的x -> Φ(x)
  • 核函数:
  • 核技巧:学习和预测时,选择使用核函数K(x,z);学习过程在映射后得空间进行
  • **核函数定理:**x输入空间,k是x*x的对称的函数

K( , )是核函数 当且仅当 对任意数据D**,Gram矩阵总是半正定的**

常用核函数:

  • 多项式核

p=2

映射函数

多项分类器

  • 高斯核函数

g(x)K(x,z)g(z)仍是核函数,g(.)是任意函数

高斯核应用广, 超参少,有限维 -> 无限维

--

相关推荐
大模型实验室Lab4AI3 分钟前
【Github热门项目】DeepSeek-OCR项目上线即突破7k+星!突破10倍无损压缩,重新定义文本-视觉信息处理
人工智能·ocr·deepseek-ocr
中科米堆6 分钟前
冲压钣金件案例 | 三维扫描3d偏差检测分析解决方案-CASAIM
人工智能·3d·3d全尺寸检测
IT_陈寒10 分钟前
React性能优化实战:我用这5个技巧将组件渲染速度提升了70%
前端·人工智能·后端
集成显卡22 分钟前
AI取名大师 | uni-app 微信小程序打包 v-bind、component 动态组件问题
人工智能·微信小程序·uni-app
小霖家的混江龙28 分钟前
AI 为啥能回答你的问题?大模型 5 步工作流程,看完秒懂!
人工智能·llm
磊磊落落29 分钟前
如何使用 Spec Kit 工具进行规范驱动开发?
人工智能
GoldenSpider.AI1 小时前
AI对话到视频的零编辑革命:NotebookLM与Lemon Slice的深度整合与未来洞察
人工智能·notebooklm·nanobanana·aivideo·lemon slice
草莓熊Lotso1 小时前
C++ STL set 系列完全指南:从底层原理、核心接口到实战场景
开发语言·c++·人工智能·经验分享·网络协议·算法·dubbo
大千AI助手3 小时前
代价复杂度剪枝(CCP)详解:原理、实现与应用
人工智能·决策树·机器学习·剪枝·大千ai助手·代价复杂度剪枝·ccp
zl_vslam4 小时前
SLAM中的非线性优-3D图优化之李群李代数在Opencv-PNP中的应用(四)
人工智能·opencv·算法·计算机视觉