几何学基本概念——超平面(hyperplane)

在几何中,超平面是将三维空间中的二维平面推广至任意维数学空间所得到的概念 。正如三维空间中的平面一样,超平面是一种"平坦(flat)"的超曲面 (hypersurface),即它是维数比其所处的环境空间 (ambient space)低一维的子空间。超平面的两个低维实例分别是平面中的一维直线,以及直线上的零维点加上前缀"超" ( hyper -) 以表明,它虽然类似于平面,但其内涵可能远不止是一个普通的二维平面。 在三维几何学中,我们通常将一个平面视为一个三维空间中的一个二维对象。在标准的 Euclid 几何中,经过某已知点且垂直于某直线的平面是唯一确定的;同理,经过平面上某已知点且垂直于该平面的直线也是唯一确定的。我们希望将这种"直线与平面"之间的关联推广至更高维度。这正是"超平面"定义为 n - 1 维的原因------因为它恰好是该空间中某个 1 维子空间的正交补。

最常见的情况是,环境空间为n 维Euclid空间;在此情形下,超平面即为 (n - 1) 维的"平坦子空间"(flats),每一个超平面都将该空间分割为两个半空间。关于超平面的反射是一种"运动"(即保持点间距离不变的几何变换),而所有的运动共同构成了一个群,该群正是由这些反射所生成的。凸多胞形(A convex polytope)则是若干个半空间的交集。

在非Euclid几何中,环境空间可能是 n 维球面、双曲空间,或者更一般地,是伪Riemann空间形式;此时的超平面则是由所有穿过某一点且垂直于特定法测地线的测地线所构成的超曲面。

在其他类型的环境空间中,Euclid空间所具备的某些性质可能不再适用。例如,在仿射空间中,由于不存在距离的概念,因此也就无所谓反射或运动。而在像椭圆空间或射影空间这类不可定向的空间中,则不存在"半空间"这一概念。从最广义的角度来看,只要某个数学空间中定义了子空间的维数概念,那么"超平面"这一概念在该空间中便具有其确切的意义。

子空间与其环境空间之间的维数之差,称为该子空间的"余维数"(codimension)。超平面的余维数恒为 1 。

在计算机科学中,超平面是指利用直线或平面来分隔多维空间中不同区域的一种概念。超平面通常通过方程来表示,并可依据数据点相对于超平面的位置,将其归入不同的类别。最优超平面是指能够最大化超平面自身与来自两个类别的最近数据点之间间隔(即"间隔")的那个超平面。

此类超平面常用于分类算法中(例如支持向量机 [SVM] 和线性回归),旨在将属于不同类别的数据点区分开来。此外,它们也被应用于聚类算法中,用于识别输入空间内的数据点簇。

为了在分类任务中确定理想的超平面,算法通常致力于最大化该超平面与各类别中距离其最近的数据点之间的"间隔"(margin);这是因为,更宽阔的间隔往往能自然地构建出更为稳健且泛化能力更强的模型。

超平面同样适用于回归任务,此类任务的目标是预测连续的输出数值,而非类别标签。在此情境下,超平面代表着那条"最佳拟合线",其作用在于最小化预测值与实际值之间误差平方之和。

相关推荐
Brilliantwxx1 天前
【C++】 继承与多态(中)
开发语言·c++·笔记·算法
一个王同学1 天前
从零到一 | CV转多模态大模型 | week09 | Minillava Refactor结合手搓和llava源码深入理解多模态大模型原理
人工智能·深度学习·机器学习·计算机视觉·改行学it
赢乐1 天前
大模型学习笔记:检索增强生成(RAG)架构
人工智能·python·深度学习·机器学习·智能体·幻觉·检索增强生成(rag)
鱼很腾apoc1 天前
【学习篇】第20期 超详解 C++ 多态:从语法规则到底层原理
java·c语言·开发语言·c++·学习·算法·青少年编程
小许同学记录成长1 天前
三维重建技术文档
算法·无人机
小O的算法实验室1 天前
2026年ASOC,基于多目标优化去噪双存档进化算法+路径规划,深度解析+性能实测
算法·论文复现·智能算法·智能算法改进
2601_954526751 天前
逆向解析Temu底层动销算法:基于API高并发轮询与全域存量透视的自动化架构重构
算法·架构·自动化
Σίσυφος19001 天前
数据标准化(拟合的时候使用非常重要)
人工智能·算法
knight_9___1 天前
大模型project面试7
人工智能·python·算法·面试·大模型·agent