数据挖掘——支持向量机分类器

数据挖掘------支持向量机分类器

支持向量机

根据统计学习理论,学习机器的实际风险由经验风险值置信范围值 两部分组成。而基于经验风险最小化准则的学习方法只强调了训练样本的经验风险最小误差,没有最小化 置信范围值,因此其泛化能力较差。

Vapnik于1995年提出的支持向量机(Support Vector Machine, SVM)以训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,即SVM是一种基于结构风险最小化准则的学习方法,其泛化能力明显优于一些传统的学习方法。

由于SVM 的求解最后转化成二次规划问题的求解,因此SVM的解是全局唯一的最优解

SVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。

最小间隔面推导

注意分类的间隔为 2 ∣ ∣ w ∣ ∣ \frac{2}{||w||} ∣∣w∣∣2,不是 1 ∣ ∣ w ∣ ∣ \frac{1}{||w||} ∣∣w∣∣1

SVM目标函数求解:对偶问题求解

支持向量机解的稀疏性:训练完成后,大部分的训练样本都不需保留,最终模型仅与支持向量有关。

稀疏性理论解释:

基于软间隔的C-SVM

非线性SVM与核变换


观察以上两个式子可见:无论判别函数还是对偶形式中的目标函数都只涉及到高维空间中两个矢量之间的内积,而并不需要知道它们的具体坐标。

常用核函数

相关推荐
John_ToDebug19 分钟前
大模型提示词(Prompt)终极指南:从原理到实战,让AI输出质量提升300%
人工智能·chatgpt·prompt
居然JuRan19 分钟前
LangGraph从0到1:开启大模型开发新征程
人工智能
Miraitowa_cheems21 分钟前
LeetCode算法日记 - Day 11: 寻找峰值、山脉数组的峰顶索引
java·算法·leetcode
双向3328 分钟前
实战测试:多模态AI在文档解析、图表分析中的准确率对比
人工智能
用户51914958484530 分钟前
1989年的模糊测试技术如何在2018年仍发现Linux漏洞
人工智能·aigc
人类发明了工具31 分钟前
【深度学习-基础知识】单机多卡和多机多卡训练
人工智能·深度学习
用户51914958484542 分钟前
检索增强生成(RAG)入门指南:构建知识库与LLM协同系统
人工智能·aigc
CoovallyAIHub43 分钟前
方案 | 动车底部零部件检测实时流水线检测算法改进
深度学习·算法·计算机视觉
CoovallyAIHub1 小时前
方案 | 光伏清洁机器人系统详细技术实施方案
深度学习·算法·计算机视觉
星期天要睡觉1 小时前
机器学习——CountVectorizer将文本集合转换为 基于词频的特征矩阵
人工智能·机器学习·矩阵