吴恩达《机器学习》12-2-12-3:大边界的直观理解、大边界分类背后的数学

一、大边界的直观理解

1. 大间距分类器的背景

支持向量机的大间距分类器着眼于构建一个能够在正负样本之间划定最大间距的决策边界。为了理解这一点,首先观察支持向量机的代价函数,其中涉及到正负样本的代价函数cos𝑡1(𝑧)和cos𝑡0(𝑧)。

对于正样本(𝑦 = 1),我们希望𝜃^𝑇𝑥的值大于等于 1,而对于负样本(𝑦 = 0),希望𝜃^𝑇𝑥的值小于等于 -1。这要求决策边界不仅能够正确分离样本,还需要具备足够的"安全间距"。

2. 支持向量机的大间距特性

支持向量机不仅仅追求正确分类样本,更强调在分类过程中保持最大的间距。这一点通过引入一个常数𝐶来体现,当𝐶取非常大的值时,最小化代价函数将迫使𝜃^𝑇𝑥的值趋近于零,即实现最大间距分类器。

3. 优化问题与决策边界

通过解决一个相应的优化问题,可以得到支持向量机的决策边界。当𝐶非常大时,最优解将使得代价函数的第一项为零,从而得到一个大间距分类器。这种分类器在分离正负样本时更为鲁棒,因为它努力最大化正负样本之间的距离。

4. 正则化参数𝐶的影响

正则化参数𝐶的选择在支持向量机中至关重要。当𝐶较大时,相当于正则化参数𝜆较小,可能导致过拟合;而当𝐶较小时,相当于正则化参数𝜆较大,可能导致欠拟合。这表明𝐶的取值影响模型的偏差和方差,需要在训练中进行平衡。

二、大边界分类背后的数学

  1. 向量内积: 假设有两个向量 𝑢 和 𝑣,它们的内积表示为 𝑢^𝑇𝑣。通过将向量投影到另一个向量上,可以计算投影的长度,即内积。

  2. 向量范数: 向量的范数表示其长度,通常使用欧几里得范数表示。对于二维向量 𝑢 = [𝑢1, 𝑢2],其范数为 ∥𝑢∥ = √(𝑢1^2 + 𝑢2^2)。

  3. 内积的计算: 内积 𝑢^𝑇𝑣 可以通过向量的点乘(𝑢1 × 𝑣1 + 𝑢2 × 𝑣2)或矩阵乘法 ([𝑢1 𝑢2] × [𝑣1, 𝑣2]) 计算。这两种方法得到的结果是相同的。

  4. 内积的性质: 内积具有交换性,即 𝑢^𝑇𝑣 = 𝑣^𝑇𝑢。此外,内积的结果是两个实数的乘积。

  5. 投影和内积的关系: 通过投影计算内积时,投影长度记为 𝑝,内积可以表示为 𝑢^𝑇𝑣 = 𝑝⬝∥𝑢∥。

  6. 符号和夹角: 投影的长度 𝑝 可能是正值或负值,取决于向量 𝑢 和 𝑣 之间的夹角。夹角大于 90 度时,投影为负值。

  7. 支持向量机目标函数: 支持向量机的目标函数是极小化参数向量 𝜃 的范数的平方,即最小化 1/2 ∥𝜃∥^2。

  8. 大间隔分类: 通过选择大间隔分类器,支持向量机追求最大化训练样本到决策边界的距离(间距),从而使参数向量的范数最小。

  9. 简化假设: 在推导中,作者简化了截距为零(𝜃0 = 0)和特征数为 2 的情况,使目标函数更容易分析。

  10. 决策边界选择: 选择大间隔分类器的决策边界可以使参数向量的范数最小,从而实现大间隔分类。

参考资料

[中英字幕]吴恩达机器学习系列课程

黄海广博士 - 吴恩达机器学习个人笔记

相关推荐
Re.不晚4 分钟前
Java入门15——抽象类
java·开发语言·学习·算法·intellij-idea
听忆.19 分钟前
手机屏幕上进行OCR识别方案
笔记
艾派森21 分钟前
大数据分析案例-基于随机森林算法的智能手机价格预测模型
人工智能·python·随机森林·机器学习·数据挖掘
幼儿园老大*1 小时前
走进 Go 语言基础语法
开发语言·后端·学习·golang·go
Selina K1 小时前
shell脚本知识点记录
笔记·shell
1 小时前
开源竞争-数据驱动成长-11/05-大专生的思考
人工智能·笔记·学习·算法·机器学习
ctrey_1 小时前
2024-11-4 学习人工智能的Day21 openCV(3)
人工智能·opencv·学习
啦啦右一1 小时前
前端 | MYTED单篇TED词汇学习功能优化
前端·学习
忘梓.1 小时前
划界与分类的艺术:支持向量机(SVM)的深度解析
机器学习·支持向量机·分类
Chef_Chen2 小时前
从0开始机器学习--Day17--神经网络反向传播作业
python·神经网络·机器学习