4.1 spectral clusterig

一、三维点云的聚类 00:01

三维点云的第四节课主要讲解聚类及模型拟合算法。聚类部分将深入讲解普聚类原理，并介绍min shift和dbs can算法。模型拟合部分涵盖三个核心算法：最小二乘法、霍夫变换以及RANSAC算法。

1.上节内容总结 00:27

上节课的聚类算法总结如下：

k-means与GMM的关联性：两者均可用EM算法解释，k-means是GMM的特例。
算法局限性：k-means和GMM在同心圆、月牙形数据分布中失效，因其假设同类元素在欧式空间邻近。
谱聚类优势：基于连通性而非几何距离划分数据，可自动确定类别数量k，其数学原理为本节课重点。

2.普聚类 01:33

1) 普聚类的几个步骤 01:36

谱聚类的实现步骤如下：

构建相似矩阵W：元素相似度越高，对应矩阵值越大。
计算拉普拉斯矩阵L：L=D-W，其中D为W行和构成的对角矩阵。
特征值分解：提取L矩阵最小k个特征值对应的特征向量，构成n×k矩阵V。
聚类执行：对V矩阵各行进行k-means聚类，后两步本质为k-means的常规操作，核心在于拉普拉斯矩阵的构建与特征分解。

2) k值的选择 02:54

通过特征值间隔（eigen gap）确定类别数k：对拉普拉斯矩阵L的特征值排序后，显著间隔前的特征值数量即为合理k值。例如图示中四个特征值前的间隔表明数据宜分为四类。

3) 标准化普聚类 03:32

谱聚类的数学等价性：

未标准化谱聚类：近似等价于RatioCut图切割方法。
标准化谱聚类：使用归一化拉普拉斯矩阵时，等价于NormalizedCut。两种图切割的数学表达式差异体现在分区大小的衡量标准（节点数量vs边权重和）。

4) 谱聚类 04:12

图最小切割

谱聚类的图切割本质：将数据点视为图节点，切割目标是使跨类边的权重和最小（MinCut问题）。多类别扩展时，每次切割考虑子集与其补集的分割。谱聚类成功的关键在于图结构能反映数据的自然分组。

图最小切割的问题

MinCut的缺陷：单纯最小化切割边权重会导致单点成类的无效分割。解决方案是引入分区大小约束，要求每个分区的规模不低于阈值。

分区的大和小

分区规模的两种量化方式：
节点数量|A|：分区的基数。
体积volume(A)：分区内所有边权重之和，数学表达式为∑d_i（d_i为节点i的边权和）。

未规范化和规范化谱聚类

图切割的两种形式对比：

类型	约束目标	对应谱聚类	适用性
RatioCut	分区节点数均衡	未标准化谱聚类	理论分析简便
NormalizedCut	分区边权和均衡	标准化谱聚类	实际效果更优

标准化方法的优势：NormalizedCut同时满足类间差异最大化与类内相似度最大化，因volume(A)直接反映分区内连接紧密程度。

...

5) 谱聚类的直观理解 58:47

谱聚类具有双重理解视角：

图切割视角：通过最小化类间连接实现聚类

降维视角：将n维相似矩阵降至k维特征空间

归一化谱聚类通常更优，因其通过边权重和度量分区相似性，更好满足"类内相似、类间相异"的聚类目标。

3.谱聚类总结 01:00:19

谱聚类特性总结：

复杂度：O(n³)（源于拉普拉斯矩阵特征分解）
优点：
- 适用性广：不依赖几何空间假设
- 自动估计类别数
缺点：
- 计算瓶颈：万级数据难以处理
- 改进方案：
  - 采用稀疏矩阵优化
  - 改用DBSCAN等高效算法

4.1 spectral clusterig

一、三维点云的聚类 ﻿00:01

1.上节内容总结 ﻿00:27

2.普聚类 ﻿01:33

1) 普聚类的几个步骤 ﻿01:36

2) k值的选择 ﻿02:54

3) 标准化普聚类 ﻿03:32

4) 谱聚类 ﻿04:12

5) 谱聚类的直观理解 ﻿58:47

3.谱聚类总结 ﻿01:00:19