支持向量机(第二十九节课内容总结)

1. 分类边界与支持向量的几何意义

  • 超平面:用于将不同类别的数据分开,在二维情况下是直线,在更高维空间中是超平面。

  • 定义:超平面由权重向量 w 和偏置 b 定义,方程为 wTx+b=0。

  • 支持向量:距离超平面最近的样本点,位于分类边界两侧,对决策边界有决定性影响。

2. 核心优化目标------最大化间隔(Margin)

  • 间隔(Margin):两类支持向量到超平面的最短距离。

  • 优化目标:最大化间隔 D,等价于最大化 ∥w∥2​ 或最小化 ∥w∥2。

  • 鲁棒性:通过最大化间隔,提高模型对噪声和异常值的容忍度。

3. 分类约束条件的设计

  • 约束条件:所有训练样本满足 yi​(wTxi​+b)≥1,其中 yi​ 为类别标签(+1 或 -1)。

  • 拉格朗日乘子:引入 αi​ 将不等式约束转化为等式约束,构建拉格朗日函数进行优化。

4. 拉格朗日乘子法与对偶问题的求解

  • 拉格朗日乘子法:将原问题转化为对偶问题。

  • 对偶问题:在对偶问题中,参数 αi​ 成为主变量,满足 αi​≥0 且 ∑αi​yi​=0。

  • 模型参数:w=∑αi​yi​xi​,b 由 b=yi​−wTxi​ 推导得出。

  • 预测模型:y^​=sign(∑αi​yi​xiT​xj​+b)。

5. 数学推导中的关键技巧与目的

  • 误差为零:通过引入 yi​(wTxi​+b)≥1 的条件,确保模型预测与真实标签一致。

  • 简化计算:通过对目标函数进行放缩(如乘以 21​)简化计算。

  • 等价转换:利用 ∥w∥−1 的最大化等价于 ∥w∥ 的最小化。

  • 求导处理:通过处理 αi​ 转换变量,减少参数数量,提升求解效率。

相关推荐
咋吃都不胖lyh1 小时前
CLIP 不是一个 “自主判断图像内容” 的图像分类模型,而是一个 “图文语义相似度匹配模型”—
人工智能·深度学习·机器学习
智者知已应修善业1 小时前
【查找字符最大下标以*符号分割以**结束】2024-12-24
c语言·c++·经验分享·笔记·算法
91刘仁德2 小时前
c++类和对象(下)
c语言·jvm·c++·经验分享·笔记·算法
diediedei2 小时前
模板编译期类型检查
开发语言·c++·算法
阿杰学AI2 小时前
AI核心知识78——大语言模型之CLM(简洁且通俗易懂版)
人工智能·算法·ai·语言模型·rag·clm·语境化语言模型
mmz12072 小时前
分治算法(c++)
c++·算法
睡一觉就好了。2 小时前
快速排序——霍尔排序,前后指针排序,非递归排序
数据结构·算法·排序算法
Tansmjs3 小时前
C++编译期数据结构
开发语言·c++·算法
金枪不摆鳍3 小时前
算法-字典树
开发语言·算法
diediedei3 小时前
C++类型推导(auto/decltype)
开发语言·c++·算法