支持向量机(第二十九节课内容总结)

1. 分类边界与支持向量的几何意义

  • 超平面:用于将不同类别的数据分开,在二维情况下是直线,在更高维空间中是超平面。

  • 定义:超平面由权重向量 w 和偏置 b 定义,方程为 wTx+b=0。

  • 支持向量:距离超平面最近的样本点,位于分类边界两侧,对决策边界有决定性影响。

2. 核心优化目标------最大化间隔(Margin)

  • 间隔(Margin):两类支持向量到超平面的最短距离。

  • 优化目标:最大化间隔 D,等价于最大化 ∥w∥2​ 或最小化 ∥w∥2。

  • 鲁棒性:通过最大化间隔,提高模型对噪声和异常值的容忍度。

3. 分类约束条件的设计

  • 约束条件:所有训练样本满足 yi​(wTxi​+b)≥1,其中 yi​ 为类别标签(+1 或 -1)。

  • 拉格朗日乘子:引入 αi​ 将不等式约束转化为等式约束,构建拉格朗日函数进行优化。

4. 拉格朗日乘子法与对偶问题的求解

  • 拉格朗日乘子法:将原问题转化为对偶问题。

  • 对偶问题:在对偶问题中,参数 αi​ 成为主变量,满足 αi​≥0 且 ∑αi​yi​=0。

  • 模型参数:w=∑αi​yi​xi​,b 由 b=yi​−wTxi​ 推导得出。

  • 预测模型:y^​=sign(∑αi​yi​xiT​xj​+b)。

5. 数学推导中的关键技巧与目的

  • 误差为零:通过引入 yi​(wTxi​+b)≥1 的条件,确保模型预测与真实标签一致。

  • 简化计算:通过对目标函数进行放缩(如乘以 21​)简化计算。

  • 等价转换:利用 ∥w∥−1 的最大化等价于 ∥w∥ 的最小化。

  • 求导处理:通过处理 αi​ 转换变量,减少参数数量,提升求解效率。

相关推荐
Tan_Zhixia8 分钟前
时间复杂度判断
数据结构·c++·算法
雪弯了眉梢24 分钟前
OpenGL(八)摄像机(Camera)
算法·图形渲染·opengl
~~李木子~~25 分钟前
基于 MovieLens-100K 数据集的推荐算法设计与实现
算法·机器学习·推荐算法
Abona25 分钟前
智驾空间智能、物理智能、世界模型相关的最新论文和开源算法链接
算法
Heyxy34 分钟前
RobustMerge—— 无训练的 PEFT 模型融合方法,从低秩分解视角揭示方向鲁棒性对 PEFT 融合的作用
人工智能·深度学习·机器学习·大模型
sonadorje1 小时前
群的阶、元素的阶和基点G的阶详解
算法·安全
Y_fulture1 小时前
datawhale组队学习:第一章习题
学习·机器学习·概率论
csuzhucong1 小时前
一阶鬼魔魔方
算法
qq_418247881 小时前
恒源云/autodl与pycharm远程连接
ide·人工智能·python·神经网络·机器学习·pycharm·图论
科学最TOP1 小时前
AAAI25|基于神经共形控制的时间序列预测模型
人工智能·深度学习·神经网络·机器学习·时间序列