LNCS-2009《Adaptive Sampling for $k$-Means Clustering》论文的核心思想是通过自适应采样(adaptive sampling)改进 k k k-means聚类的初始化过程,提出一种高效的算法,生成 O ( k ) O(k) O(k)个中心,以常数概率获得 k k k-means问题的常数因子双标准(bi-criteria)近似解,并在这些中心中通过线性规划(LP)技术提取 k k k个中心,获得常数因子近似解。传统 k k k-means++算法通过 D 2 D^2 D2采样获得期望上 O ( log k ) O(\log k) O(logk)近似,但其时间