神经网络章节感知机部分 空间中任意一点到线性分割超平面的距离公式 解释说明

公式 8-3 的内容如下:
1 ∣ ∣ w ∣ ∣ ∣ w ⋅ x 0 + b ∣ \frac{1}{||w||} |w \cdot x_0 + b| ∣∣w∣∣1∣w⋅x0+b∣

公式 8-3 的详细解释:

这个公式表示某个点 x 0 x_0 x0 到一个超平面的距离,其中:

  • w w w 是感知机的权重向量。
  • b b b 是感知机的偏置项(或阈值)。
  • x 0 x_0 x0 是你要计算到超平面距离的点。
  • ∣ ∣ w ∣ ∣ ||w|| ∣∣w∣∣ 表示权重向量 w w w 的 L2 范数,即 w w w 的长度(欧几里得长度)。
  • w ⋅ x 0 w \cdot x_0 w⋅x0 表示向量 w w w 和点 x 0 x_0 x0 的点积。

公式的形式是通过点积 w ⋅ x 0 + b w \cdot x_0 + b w⋅x0+b 表示 x 0 x_0 x0 点相对于超平面的位置,然后通过除以权重向量 w w w 的 L2 范数来标准化,这样得到的就是该点到超平面的垂直距离

解释步骤:

  1. w ⋅ x 0 + b w \cdot x_0 + b w⋅x0+b

    • 这个表达式表示 x 0 x_0 x0 代入超平面方程 w ⋅ x + b = 0 w \cdot x + b = 0 w⋅x+b=0 后的值。它可以看作 x 0 x_0 x0 点相对于超平面的"签名距离"(带正负符号的距离)。如果结果为正,则点 x 0 x_0 x0 在超平面的一侧;如果为负,则在另一侧;如果为零,则点 x 0 x_0 x0 刚好位于超平面上。
  2. ∣ ∣ w ∣ ∣ ||w|| ∣∣w∣∣

    • ∣ ∣ w ∣ ∣ ||w|| ∣∣w∣∣ 是权重向量 w w w 的 L2 范数,即权重向量的欧几里得长度。它用于将点积结果进行标准化,使得我们得到的距离是点到超平面的垂直距离,而不是简单的点积结果。
  3. 1 ∣ ∣ w ∣ ∣ \frac{1}{||w||} ∣∣w∣∣1

    • 通过将点积结果除以 ∣ ∣ w ∣ ∣ ||w|| ∣∣w∣∣,我们消除了方向的影响,得到的是点 x 0 x_0 x0 到超平面的最短距离 ,而不是简单的欧几里得距离。这确保了无论 w w w 向量的大小如何,计算出的距离都能正确反映点到超平面的真实距离。
  4. ∣ w ⋅ x 0 + b ∣ |w \cdot x_0 + b| ∣w⋅x0+b∣

    • 绝对值符号消除了结果的正负号,使我们关心的只是距离的大小,而不是点位于超平面的哪一侧。

几何解释:

超平面可以看作是 n 维空间中的一个 ( n − 1 ) (n-1) (n−1) 维的分隔线或分隔面。公式 8-3 表示从点 x 0 x_0 x0 垂直到超平面的距离。这个公式给出的距离是经过标准化的,因此它独立于权重 w w w 的规模。

总结:

公式 8-3 给出了任意输入点 x 0 x_0 x0 到由权重向量 w w w 和偏置 b b b 所定义的超平面的垂直距离。这在感知机学习中很重要,因为我们希望通过调整权重和偏置,将误分类样本的距离缩短,从而将它们正确分类到超平面的一侧。

相关推荐
用户57573033462417 小时前
🚀 告别“意大利面条”代码:用 LangChain 像搭乐高一样玩转大模型
人工智能
蕤葳-17 小时前
深度解析:基于AI人才标准,为职场新人规划一级与二级认证的报考路径
人工智能
只与明月听17 小时前
RAG深入学习之向量数据库
前端·人工智能·python
月诸清酒17 小时前
别让你的 Coding Agent 瞎忙活,你最缺的可能是这套 Harness 规则
人工智能
极客老王说Agent17 小时前
别被OpenClaw的30万Star晃了眼!AI产业逻辑重写后,打工人更该看清谁在“真干活”
人工智能·ai·chatgpt
Bruce204899817 小时前
OpenClaw 零基础全解析(小白友好版)
人工智能·chatgpt
Bruce204899818 小时前
OpenClaw 自定义Skill插件开发全流程(2026最新版)
人工智能
TengTaiTech18 小时前
从航空级混音到AI协同指挥:基于QCC5181与大模型打造新一代智能耳机
人工智能·qcc·混音
水如烟18 小时前
孤能子视角:关系枢纽与大模型
人工智能
ZiLing18 小时前
做 AI Agent Runtime 半年后,我发现它根本不是“会调用工具的 LLM”
人工智能·agent