【机器学习 复习】第6章 支持向量机(SVM)

一、概念

1.支持向量机(support vector machine,SVM):

(1)基于统计学理论的监督学习方法,但不属于生成式模型,而是判别式模型。

(2)支持向量机在各个领域内的模式识别问题中都有广泛应用,包括人脸识别、文本分类、笔迹识别等。

(3)在解决小样本、非线性及高维模式识别等问题中表现出了许多特有的优势。

(4)在函数模拟、模式识别和数据分类等领域也取得了极好的应用效果。

2.分三种,但是前两种差不多:

(1)线性可分时,通过硬间隔最大化。

(2)近似线性可分时,通过软间隔最大化。

(3)不可分时,通过使用核技巧以及软间隔最大化。

3.线性可分SVM

(1)原理:在这n维的数据空间中找到一个超平面(Hyper Plane),将所有的正例划分到超平面的一侧,将所有的负例划分到超平面的另一侧。

(2)超平面可以有无数个,所以寻找边际最大的平面。

(3)硬间隔缺点:

对于异常值过于敏感,就是有的值它离超平面异常的近,导致一系列问题

(4)所以引入了软间隔,也就是上面的近似线性可分,它nb在允许少量分类错误,以此消除硬间隔所产生的问题。

(5)上述只是二分类,但是多分类也可以,不要产生思维禁锢,了解即可。

4.非线性问题(核函数)

(1)在空间中无法用一条直线(线性)将数据集中的正例和负例正确地分隔开,但可以用一条圆形曲线(非线性)分隔。

(2)对此,采用核函数来解决,原理是从低纬升至高维,是的,你没有看错,相当于从一张纸变成一块积木。

但是看似复杂了,但是实际上也确实很难。

但是解释起来很简单,就是把正例和负例从原来在一个面上剥离,一个全部在"上面",一个全部在下面。

(3)对此产生的问题:维度灾难

二、习题

多选题:

  1. 下列关于支持向量机的说法正确的是( ABC )

A、可用于多分类问题

B、超平面的位置仅由支持向量决定,与其他样本点无关。

C、支持非线性的核函数

D、是一种监督式的学习方法,属于生成式模型。

相关推荐
Hello娃的13 分钟前
【神经网络】反向传播BP算法
人工智能·神经网络·算法
lynnlovemin19 分钟前
从暴力到高效:C++ 算法优化实战 —— 排序与双指针篇
java·c++·算法
非著名架构师21 分钟前
破解“AI幻觉”,锁定真实风险:专业气象模型如何为企业提供可信的极端天气决策依据?
人工智能·深度学习·机器学习·数据分析·风光功率预测·高精度气象数据·高精度天气预报数据
jinxinyuuuus25 分钟前
快手在线去水印:短链解析、API逆向与视频流的元数据重构
前端·人工智能·算法·重构
忆~遂愿27 分钟前
昇腾 Triton-Ascend 开源实战:架构解析、环境搭建与配置速查
人工智能·python·深度学习·机器学习·自然语言处理
Flash.kkl29 分钟前
优先算法专题十五——BFS_FloodFill
算法·宽度优先
高洁0137 分钟前
向量数据库拥抱大模型
python·深度学习·算法·机器学习·transformer
慕容青峰39 分钟前
牛客小白月赛 103 C 题题解
c++·算法·sublime text
小龙报40 分钟前
【算法通关指南:算法基础篇(四)】二维差分专题:1.【模板】差分 2.地毯
c语言·数据结构·c++·深度学习·神经网络·算法·自然语言处理
立志成为大牛的小牛41 分钟前
数据结构——五十八、希尔排序(Shell Sort)(王道408)
数据结构·学习·程序人生·考研·算法·排序算法