支持向量机(第二十九节课内容总结)

1. 分类边界与支持向量的几何意义

  • 超平面:用于将不同类别的数据分开,在二维情况下是直线,在更高维空间中是超平面。

  • 定义:超平面由权重向量 w 和偏置 b 定义,方程为 wTx+b=0。

  • 支持向量:距离超平面最近的样本点,位于分类边界两侧,对决策边界有决定性影响。

2. 核心优化目标------最大化间隔(Margin)

  • 间隔(Margin):两类支持向量到超平面的最短距离。

  • 优化目标:最大化间隔 D,等价于最大化 ∥w∥2​ 或最小化 ∥w∥2。

  • 鲁棒性:通过最大化间隔,提高模型对噪声和异常值的容忍度。

3. 分类约束条件的设计

  • 约束条件:所有训练样本满足 yi​(wTxi​+b)≥1,其中 yi​ 为类别标签(+1 或 -1)。

  • 拉格朗日乘子:引入 αi​ 将不等式约束转化为等式约束,构建拉格朗日函数进行优化。

4. 拉格朗日乘子法与对偶问题的求解

  • 拉格朗日乘子法:将原问题转化为对偶问题。

  • 对偶问题:在对偶问题中,参数 αi​ 成为主变量,满足 αi​≥0 且 ∑αi​yi​=0。

  • 模型参数:w=∑αi​yi​xi​,b 由 b=yi​−wTxi​ 推导得出。

  • 预测模型:y^​=sign(∑αi​yi​xiT​xj​+b)。

5. 数学推导中的关键技巧与目的

  • 误差为零:通过引入 yi​(wTxi​+b)≥1 的条件,确保模型预测与真实标签一致。

  • 简化计算:通过对目标函数进行放缩(如乘以 21​)简化计算。

  • 等价转换:利用 ∥w∥−1 的最大化等价于 ∥w∥ 的最小化。

  • 求导处理:通过处理 αi​ 转换变量,减少参数数量,提升求解效率。

相关推荐
x_xbx34 分钟前
LeetCode:148. 排序链表
算法·leetcode·链表
Darkwanderor36 分钟前
三分算法的简单应用
c++·算法·三分法·三分算法
2401_831920741 小时前
分布式系统安全通信
开发语言·c++·算法
WolfGang0073211 小时前
代码随想录算法训练营 Day17 | 二叉树 part07
算法
温九味闻醉1 小时前
关于腾讯广告算法大赛2025项目分析1 - dataset.py
人工智能·算法·机器学习
炽烈小老头1 小时前
【 每天学习一点算法 2026/03/23】数组中的第K个最大元素
学习·算法·排序算法
老鱼说AI2 小时前
大规模并发处理器程序设计(PMPP)讲解(CUDA架构):第四期:计算架构与调度
c语言·深度学习·算法·架构·cuda
月落归舟2 小时前
帮你从算法的角度来认识数组------( 二 )
数据结构·算法·数组
阿贵---2 小时前
C++中的RAII技术深入
开发语言·c++·算法