核心思想
传统投影聚类方法(如 PCA+K-means)学习单一共享子空间用于所有簇,这牺牲了簇的区分性------它们倾向于捕获簇间共享成分,而丢失最具判别力的簇特定成分。FMSC 的核心创新在于:
-
同时学习多个簇特定子空间 {Sk=Span(PkPkT)}k=1c\{S_k = \text{Span}(P_kP_k^T)\}_{k=1}^c{Sk=Span(PkPkT)}k=1c 与模糊隶属度矩阵 UUU,二者形成相互增强的闭环:更精确的子空间提升隶属度准确性,更准确的隶属度指导更精细的子空间学习。
-
引入共享非正交变换矩阵 WWW 作为正则化机制,在保持跨子空间一致性的同时,不牺牲簇特定子空间重建的保真度。
-
模糊学习机制 允许样本以概率形式同时属于多个子空间,有效处理边界样本和重叠簇场景,实现一步式聚类(无需后处理如 K-means)。
目标函数
FMSC 的优化目标为:
min{Pk}k=1c,U,W∑i=1n∑k=1cuikm∥x:,i−PkWTx:,i∥22+γ∥W∥F2 \min_{\{P_k\}{k=1}^c, U, W} \sum{i=1}^n \sum_{k=1}^c u_{ik}^m \|x_{:,i} - P_k W^T x_{:,i}\|_2^2 + \gamma \|W\|_F^2 {Pk}k=1c,U,Wmini=1∑nk=1∑cuikm∥x:,i−PkWTx:,i∥22+γ∥W∥F2
约束条件:
- PkTPk=IrP_k^T P_k = I_rPkTPk=Ir(PkP_kPk 为正交矩阵,k=1,2,⋯ ,ck = 1, 2, \cdots, ck=1,2,⋯,c)
- 0≤uik≤10 \leq u_{ik} \leq 10≤uik≤1,ui,:1c=1u_{i,:} \mathbf{1}_c = 1ui,:1c=1(模糊隶属度约束)
- m>1m > 1m>1 为模糊化系数,γ>0\gamma > 0γ>0 为正则化参数
关键设计解析:
- 项 ∥x:,i−PkWTx:,i∥22\|x_{:,i} - P_k W^T x_{:,i}\|_2^2∥x:,i−PkWTx:,i∥22 表示样本在第 kkk 个子空间下的重建误差
- 模糊权重 uikmu_{ik}^muikm 使高隶属度样本对子空间学习贡献更大
- 正则项 γ∥W∥F2\gamma \|W\|_F^2γ∥W∥F2 防止 WWW 过拟合并增强数值稳定性
- 共享矩阵 WWW 满足 WTXk≈PkTXkW^T X_k \approx P_k^T X_kWTXk≈PkTXk,确保各子空间嵌入到共同潜在空间
优化过程(交替迭代)
由于目标函数非凸,采用三步交替优化策略:
1. 固定 WWW 和 UUU,更新 {Pk}\{P_k\}{Pk}
定义 X^k=X[Diag(u:,k)]m/2\hat{X}k = X[\text{Diag}(u{:,k})]^{m/2}X^k=X[Diag(u:,k)]m/2,目标转化为:
maxPktr(PkTAk),s.t. PkTPk=Ir \max_{P_k} \text{tr}(P_k^T A_k), \quad \text{s.t. } P_k^T P_k = I_r Pkmaxtr(PkTAk),s.t. PkTPk=Ir
其中 Ak=X^kX^kTWA_k = \hat{X}_k \hat{X}_k^T WAk=X^kX^kTW。对 AkA_kAk 进行 SVD:Ak=BΣVTA_k = B\Sigma V^TAk=BΣVT,最优解为:
Pk∗=B:,1:rV:,1:rT P_k^* = B_{:,1:r} V_{:,1:r}^T Pk∗=B:,1:rV:,1:rT
2. 固定 {Pk}\{P_k\}{Pk} 和 UUU,更新 WWW
目标函数重写为:
minWtr(WT(∑k=1cX^kX^kT+γId)W−2WT∑k=1cX^kX^kTPk) \min_W \text{tr}\left(W^T\left(\sum_{k=1}^c \hat{X}_k \hat{X}k^T + \gamma I_d\right)W - 2W^T \sum{k=1}^c \hat{X}_k \hat{X}_k^T P_k\right) Wmintr(WT(k=1∑cX^kX^kT+γId)W−2WTk=1∑cX^kX^kTPk)
求导并令导数为零,得闭式解:
W=(∑k=1cX^kX^kT+γId)−1(∑k=1cX^kX^kTPk) W = \left(\sum_{k=1}^c \hat{X}_k \hat{X}k^T + \gamma I_d\right)^{-1} \left(\sum{k=1}^c \hat{X}_k \hat{X}_k^T P_k\right) W=(k=1∑cX^kX^kT+γId)−1(k=1∑cX^kX^kTPk)
3. 固定 {Pk}\{P_k\}{Pk} 和 WWW,更新 UUU
定义 dik=∥x:,i−PkWTx:,i∥22d_{ik} = \|x_{:,i} - P_k W^T x_{:,i}\|_2^2dik=∥x:,i−PkWTx:,i∥22,对每个样本 iii 求解:
minui,:∑k=1cuikmdik,s.t. 0≤uik≤1, ui,:1c=1 \min_{u_{i,:}} \sum_{k=1}^c u_{ik}^m d_{ik}, \quad \text{s.t. } 0 \leq u_{ik} \leq 1, \; u_{i,:}\mathbf{1}_c = 1 ui,:mink=1∑cuikmdik,s.t. 0≤uik≤1,ui,:1c=1
通过拉格朗日乘子法,得闭式解:
uik=vik∑l=1cvil,其中 vik=(1dik)1m−1 u_{ik} = \frac{v_{ik}}{\sum_{l=1}^c v_{il}}, \quad \text{其中 } v_{ik} = \left(\frac{1}{d_{ik}}\right)^{\frac{1}{m-1}} uik=∑l=1cvilvik,其中 vik=(dik1)m−11
主要贡献
-
方法论创新:首次提出同时学习多个簇特定子空间与模糊隶属度的联合优化框架,突破传统"单一共享子空间"范式。
-
正则化设计 :提出多子空间正则化项 ∑k=1c∥WTXk−PkTXk∥F2+γ∥W∥F2\sum_{k=1}^c \|W^T X_k - P_k^T X_k\|_F^2 + \gamma \|W\|F^2∑k=1c∥WTXk−PkTXk∥F2+γ∥W∥F2,理论证明在子空间正交条件下 W∗=∑k=1cPkW^* = \sum{k=1}^c P_kW∗=∑k=1cPk 为零损失解(Proposition 1),且在 rank(XXT)=d\text{rank}(XX^T)=drank(XXT)=d 时唯一(Proposition 2)。
-
理论联系 :严格证明当簇数 c=1c=1c=1 时,FMSC 退化为带岭回归的 PCA 变体(Proposition 3),揭示了传统降维与多子空间聚类的内在联系。
-
可扩展性 :时间复杂度为 O(T(cd2n+d3))O(T(cd^2n + d^3))O(T(cd2n+d3)),与样本量 nnn 呈线性关系,成功处理含 500 万样本的合成数据集。
-
实验验证:在 12 个基准数据集(含高噪声 SVHN 和多视角数据)上,FMSC 在 ACC、NMI、F-score 三项指标上显著优于 10 种 SOTA 方法,Friedman-Nemenyi 检验确认其统计显著优势。
算法实现(Algorithm 1)
-
初始化:
- W←B:,1:rW \leftarrow B_{:,1:r}W←B:,1:r(XXX 的前 rrr 个左奇异向量)
- 随机初始化 UUU 满足 U1c=1nU\mathbf{1}_c = \mathbf{1}nU1c=1n 且 0≤uik≤10 \leq u{ik} \leq 10≤uik≤1
-
迭代更新 (直至收敛或达最大迭代次数 TTT):
- 计算加权数据矩阵 X^k=X[Diag(u:,k)]m/2\hat{X}k = X[\text{Diag}(u{:,k})]^{m/2}X^k=X[Diag(u:,k)]m/2
- 通过 SVD 更新 {Pk}\{P_k\}{Pk}(式 15)
- 通过矩阵求逆更新 WWW(式 17)
- 通过闭式解更新 UUU(式 20)
-
聚类分配 :对每个样本 xix_ixi,分配至隶属度最大的簇 k=argmaxluil∗k = \arg\max_{l} u_{il}^*k=argmaxluil∗
收敛性:目标函数单调非增且下界为 0,算法保证收敛(实验显示通常 100 次迭代内收敛)。
局限性分析
-
等维度假设限制 :FMSC 假设所有子空间维度相同(rrr 固定),而真实数据中不同簇的内在维度可能差异显著。虽论文提及可通过正交补空间扩展至 r=maxkrkr = \max_k r_kr=maxkrk,但这会引入冗余维度,可能降低子空间判别性。
-
正交性假设过强:理论分析基于 Assumption 1(子空间两两正交),但实际数据(如人脸图像)的簇子空间往往非正交。尽管实验显示 FMSC 在非理想配置下仍有效,但缺乏对非正交场景的理论保证。
-
参数敏感性:
- 子空间维度 rrr 对性能影响显著(Fig. 4 显示在 {10,20,40,70}\{10,20,40,70\}{10,20,40,70} 范围内敏感),需网格搜索
- 模糊系数 mmm 过小(→1\to 1→1)退化为硬划分,过大(>1.3>1.3>1.3)导致隶属度过模糊(Fig. 5)
- 虽 γ=103\gamma=10^3γ=103 在多数数据集表现稳健,但多视角数据需调整至 {102,103}\{10^2, 10^3\}{102,103}
-
计算瓶颈 :时间复杂度含 d3d^3d3 项(矩阵求逆),当特征维度过高(d>104d > 10^4d>104)时仍面临计算挑战,需结合随机投影等加速技术。
-
初始化依赖 :WWW 初始化依赖 PCA,若数据分布严重偏离高斯假设,可能陷入局部最优。实验中未系统评估不同初始化策略的影响。
-
理论-实践差距:正则化项设计基于子空间正交性理论,但实际应用中该条件常不满足,正则化效果的理论解释有待深化。
总结
FMSC 通过"多子空间+模糊隶属度+共享变换"的三元耦合设计,有效解决了传统投影聚类中簇区分性不足的问题。其理论严谨性(与 PCA 的联系)、算法高效性(线性可扩展)与实验优越性(12 个数据集全面验证)使其成为高维聚类的重要进展。未来工作可聚焦于:① 放宽等维度假设,设计自适应维度选择机制;② 弱化正交性约束,发展适用于一般子空间配置的理论框架;③ 结合深度学习,构建端到端的非线性多子空间聚类模型。