机器学习之支持向量机SVM

支持向量机

  • 概念

    是supported vector machine(支持向量机),即寻找一个超平面使样本分成两类,且间隔最大分类

  • 分类

    • 硬间隔

      • 若样本线性可分,且所有样本分类正确情况下,寻找最大间隔,即硬间隔

      • 若出现异常值或样本不能线性可分,则无法实现

    • 软间隔

      • 允许部分样本,在最大间隔之间,甚至在错误的一边,寻找最大间隔,即软间隔

      • 目标是尽可能保持间隔宽阔和限制间隔违例之间找到良好平衡

  • 核函数Kernel

    将原始输入空间映射到新的特征空间,使得原本线性不可分样本在核空间可分

SVMAPI
  • class sklearn.svm.LinearSVC(C=1)

  • C:惩罚参数,类似于线性回归中正则化系数

  • LinearSVC API使用方法

    • 导包:from sklearn.svm import LinearSVC

    • 实例化: mysvc = LinearSVC(C=30)

    • 训练模型:mysvc.fit(X_standard,y)

    • 输出准确率:print(myscv.score(X_standard,y))

  • 惩罚参数C对超平面影响

    C值越大,间隔越小,落在间隔中的违例越少,反之,C值越小,间隔越大,违例越多

SVM算法原理
  • 思想:要去求一组参数(w,b),使其构建的超平面函数能够最优分离两个集合
  • 样本空间中任意点x到超平面(w,b)距离可为:

  • 若想找到具有最大间隔划分超平面,也就是要找到能满右足式中约束参数w和b,使得间隔γ最大

  • 距离超平面最近的几个训练样本点使上式等号成立,他们被称为"支持向量"两个异类支持向量到超平面距离之和为:

SVM核函数
  • 作用

    将原始输入空间映射到新的特征空间,从而使原本线性不可分样本在核孔间可分

  • 分类​

    高斯核(RBF、径向基函数):产生将样本投射到无限维空间运算效果,使得原来不可分数据变得可分。使用最多

  • 高斯核函数γ作用

  • 高斯函数API

    • 导包: from sklearn.svm import SVC

    • 实例化:SVC(kernel='rbf' gamma=gamma)

    • gamama:值越大,高斯分布越窄(数据变化越剧烈,易过拟合),反之,值越小,高斯分布越宽(数据变化越平缓),易欠拟合,rbf是高斯核

    • gamama参数意义

相关推荐
橘颂TA10 小时前
【剑斩OFFER】算法的暴力美学——重排链表
算法·结构与算法
zl_vslam11 小时前
SLAM中的非线性优-3D图优化之相对位姿Between Factor位姿图优化(十三)
人工智能·算法·计算机视觉·3d
Timmylyx051811 小时前
CF 新年赛 Goodbye 2025 题解
算法·codeforces·比赛日记
闻缺陷则喜何志丹11 小时前
【二分查找】P10091 [ROIR 2022 Day 2] 分数排序|普及+
c++·算法·二分查找
only-qi11 小时前
leetcode2. 两数相加
算法·leetcode
鲨莎分不晴11 小时前
拯救暗淡图像:深度解析直方图均衡化(原理、公式与计算)
人工智能·算法·机器学习
武子康11 小时前
大数据-200 决策树信息增益详解:信息熵、ID3 选特征与 Python 最佳切分实现
大数据·后端·机器学习
DuHz11 小时前
242-267 GHz双基地超外差雷达系统:面向精密太赫兹传感与成像的65nm CMOS实现——论文阅读
论文阅读·物联网·算法·信息与通信·毫米波雷达
咚咚王者11 小时前
人工智能之核心基础 机器学习 第四章 决策树与集成学习基础
人工智能·决策树·机器学习
AI科技星12 小时前
时空的固有脉动:波动方程 ∇²L = (1/c²) ∂²L/∂t² 的第一性原理推导、诠释与验证
数据结构·人工智能·算法·机器学习·重构