数据挖掘——支持向量机分类器

数据挖掘------支持向量机分类器

支持向量机

根据统计学习理论,学习机器的实际风险由经验风险值置信范围值 两部分组成。而基于经验风险最小化准则的学习方法只强调了训练样本的经验风险最小误差,没有最小化 置信范围值,因此其泛化能力较差。

Vapnik于1995年提出的支持向量机(Support Vector Machine, SVM)以训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,即SVM是一种基于结构风险最小化准则的学习方法,其泛化能力明显优于一些传统的学习方法。

由于SVM 的求解最后转化成二次规划问题的求解,因此SVM的解是全局唯一的最优解

SVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。

最小间隔面推导

注意分类的间隔为 2 ∣ ∣ w ∣ ∣ \frac{2}{||w||} ∣∣w∣∣2,不是 1 ∣ ∣ w ∣ ∣ \frac{1}{||w||} ∣∣w∣∣1

SVM目标函数求解:对偶问题求解

支持向量机解的稀疏性:训练完成后,大部分的训练样本都不需保留,最终模型仅与支持向量有关。

稀疏性理论解释:

基于软间隔的C-SVM

非线性SVM与核变换


观察以上两个式子可见:无论判别函数还是对偶形式中的目标函数都只涉及到高维空间中两个矢量之间的内积,而并不需要知道它们的具体坐标。

常用核函数

相关推荐
普通网友3 分钟前
Bard 的模型压缩技术:在保证性能的前提下如何实现轻量化部署
人工智能·机器学习·bard
白帽子黑客罗哥12 分钟前
不同就业方向(如AI、网络安全、前端开发)的具体学习路径和技能要求是什么?
人工智能·学习·web安全
码农水水22 分钟前
小红书Java面试被问:Online DDL的INSTANT、INPLACE、COPY算法差异
算法
捕风捉你24 分钟前
【AI转行04】特征工程:治疗 AI 的“学不会”和“想太多”
人工智能·深度学习·机器学习
何贤25 分钟前
2026 年程序员自救指南
人工智能·程序员·掘金技术征文
AKAMAI29 分钟前
分布式边缘推理正在改变一切
人工智能·分布式·云计算
极新40 分钟前
智面玄赏联合创始人李男:人工智能赋能招聘行业——从效率革新到平台经济重构|2025极新AIGC峰会演讲实录
人工智能·百度
乾元1 小时前
ISP 级别的异常洪泛检测与防护——大流量事件的 AI 自动识别与响应工程
运维·网络·人工智能·安全·web安全·架构
机器之心1 小时前
多模态推理新范式!DiffThinker:用扩散模型「画」出推理和答案
人工智能·openai
linhx1 小时前
【AIGC工作流】解构AI短剧生产管线:从手动调用DeepSeek+MJ,到Agent一站式自动化的演进
人工智能·自动化·aigc