机器学习与模型识别1:SVM(支持向量机)

一、简介

SVM是一种二类分类模型,在特征空间中寻找间隔最大的分离超平面,使得数据得到高效的二分类。

二、SVM损失函数

SVM 的三种损失函数衡量模型的性能。

1. 0-1 损失:
当正例样本落在 y=0 下方则损失为 0,否则损失为 1.
当负例样本落在 y=0 上方则损失为0,否则损失为 1.
2. Hinge (合页)损失:
当正例落在 y >= 1 一侧则损失为0,否则距离越远则损失越大.
当负例落在 y <= -1 一侧则损失为0,否则距离越远则损失越大.
3. Logistic 损失:
当正例落在 y > 0 一侧,并且距离 y=0 越远则损失越小.
当负例落在 y < 0 一侧,并且距离 y=0 越远则损失越小.

当存在线性不可分的场景时,我们需要使用核函数来提高训练样本的维度、或者将训练样本投向高维,SVM 默认使用 RBF 核函数,将低维空间样本投射到高维空间,再寻找分割超平面。

  • SVM的优点:

    • 在高维空间中非常高效;
    • 即使在数据维度比样本数量大的情况下仍然有效;
  • SVM的缺点:

    • 如果特征数量比样本数量大得多,在选择核函数时要避免过拟合;

    • 对缺失数据敏感;

    • 对于核函数的高维映射解释力不强

相关推荐
北京耐用通信几秒前
从‘卡壳’到‘丝滑’:耐达讯自动化PROFIBUS光纤模块如何让RFID读写器实现‘零延迟’物流追踪?”
网络·人工智能·科技·物联网·网络协议·自动化
xier_ran6 分钟前
深度学习:Mini-batch 大小选择与 SGD 和 GD
人工智能·算法·机器学习
CodeLiving8 分钟前
MCP学习三——MCP相关概念
人工智能·mcp
Gitpchy8 分钟前
简单CNN——作业(补充)
人工智能·神经网络·cnn
齐齐大魔王10 分钟前
深度学习系列(二)
人工智能·深度学习
xier_ran11 分钟前
深度学习:学习率衰减(Learning Rate Decay)
人工智能·深度学习·机器学习
Baihai_IDP15 分钟前
如何提升 LLMs 处理表格的准确率?一项针对 11 种格式的基准测试
人工智能·面试·llm
Francek Chen20 分钟前
【CANN】开启AI开发新纪元,释放极致计算效率
人工智能·深度学习·cann·ai开发
工藤学编程27 分钟前
零基础学AI大模型之Milvus部署架构选型+Linux实战:Docker一键部署+WebUI使用
人工智能·架构·milvus
酷柚易汛智推官28 分钟前
阿里“千问”破局C端AI:开源基石与B端势能的双重革命
人工智能·开源·酷柚易汛