【机器学习】机器学习的基本分类-监督学习-支持向量机(Support Vector Machine, SVM)

支持向量机是一种强大的监督学习算法,主要用于分类问题,但也可以用于回归和异常检测。SVM 的核心思想是通过最大化分类边界的方式找到数据的最佳分离超平面。


1. 核心思想

目标

给定训练数据 ,其中 是特征向量, 是标签,SVM 的目标是找到一个超平面将数据分开,同时最大化分类边界的间隔。

决策函数

超平面可以表示为:

其中:

  • w 是超平面的法向量。
  • b 是偏置项,决定超平面与原点的距离。

分类条件

优化目标

最大化边界的间隔(Margin),即:

同时满足分类条件:

通过拉格朗日对偶问题,最终转化为凸优化问题求解。


2. 线性 SVM

损失函数

对线性可分的数据,优化问题为:

当数据不可完全分离时,引入松弛变量

  • C 是正则化参数,控制对误分类的容忍度。

3. 非线性 SVM

对于线性不可分的数据,SVM 使用核技巧(Kernel Trick)将数据映射到高维特征空间,使其在高维空间中线性可分。

核函数

核函数 表示输入数据在高维空间的内积:

常用核函数:

  1. 线性核
  1. 多项式核
  1. 高斯核(RBF)
  1. Sigmoid 核

4. SVM 的分类过程

  1. 训练阶段:通过优化问题学习权重 w 和偏置 b。
  2. 预测阶段:计算输入数据到超平面的距离,决定类别标签。

5. 优势与劣势

优势

  1. 适合高维数据:在高维数据中仍表现良好。
  2. 非线性处理能力强:通过核技巧解决非线性问题。
  3. 全局最优解:优化问题是凸的,不容易陷入局部最优。

劣势

  1. 效率问题:对大规模数据或高维特征数据训练速度较慢。
  2. 参数敏感性 :核函数和正则化参数 C、核参数(如 )需要精心调试。
  3. 对噪声敏感:容易受到噪声数据的影响。

6. 代码示例

以下是使用 sklearn 实现 SVM 的分类示例。

分类示例

python 复制代码
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 加载数据
iris = datasets.load_iris()
X = iris.data[:, :2]  # 取前两个特征
y = (iris.target != 0).astype(int)  # 二分类任务

# 分割数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 训练 SVM 模型
model = SVC(kernel='linear', C=1.0)
model.fit(X_train, y_train)

# 预测
y_pred = model.predict(X_test)

# 评估
print("Accuracy:", accuracy_score(y_test, y_pred))

输出结果

bash 复制代码
Accuracy: 1.0

核函数示例

python 复制代码
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 加载数据
iris = datasets.load_iris()
X = iris.data[:, :2]  # 取前两个特征
y = (iris.target != 0).astype(int)  # 二分类任务

# 分割数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 使用 RBF 核
model_rbf = SVC(kernel='rbf', gamma=0.7, C=1.0)
model_rbf.fit(X_train, y_train)

# 预测与评估
y_pred_rbf = model_rbf.predict(X_test)
print("Accuracy with RBF kernel:", accuracy_score(y_test, y_pred_rbf))

输出结果

bash 复制代码
Accuracy with RBF kernel: 1.0

7. 应用场景

  1. 文本分类与情感分析:如垃圾邮件分类。
  2. 图像分类:如手写数字识别。
  3. 生物信息学:如基因分类。
  4. 异常检测:如检测网络入侵。
相关推荐
杰克逊的日记2 分钟前
大语言模型应用和训练(人工智能)
人工智能·算法·语言模型
意.远14 分钟前
PyTorch参数管理详解:从访问到初始化与共享
人工智能·pytorch·python·深度学习
非优秀程序员23 分钟前
分享 | 我遇到的质量最高的MCP服务器汇总
人工智能
Sui_Network30 分钟前
Webacy 利用 Walrus 技术构建链上风险分析决策层
人工智能·游戏·web3·去中心化·区块链
知来者逆1 小时前
计算机视觉——为什么 mAP 是目标检测的黄金标准
图像处理·人工智能·深度学习·目标检测·计算机视觉
MobiCetus1 小时前
Deep Reinforcement Learning for Robotics翻译解读2
人工智能·深度学习·神经网络·机器学习·生成对抗网络·计算机视觉·数据挖掘
师范大学生2 小时前
基于LSTM的文本分类2——文本数据处理
人工智能·rnn·lstm
Listennnn2 小时前
自动化网络架构搜索(Neural Architecture Search,NAS)
人工智能·深度学习·自动化
zhz52142 小时前
Zapier MCP:重塑跨应用自动化协作的技术实践
运维·人工智能·ai·自动化·ai编程·ai agent·智能体
怎么全是重名2 小时前
OFP--2018
人工智能·神经网络·目标检测