K-Means算法进行分类

微笑伴你而行2023-11-21 21:43

已知数据集D中有9个数据点，分别是（1,2），(2,3), (2,1), (3,1),(2,4),(3,5),(4,3),(1,5),(4,2)。采用K-Means算法进行聚类，k=2，设初始中心点为（1.1,2.2），（2.3,3.5）。试模拟K-Means算法的一次迭代过程，即先计算样本点到类中心点的距离，然后把样本点划分到最近的类中，最后更新类中心点的坐标

数据集合D：{(1,2),(2,3),(2,1),(3,1),(2,4),(3,5),(4,3),(1,5),(4,2)} 初始中心点： C1=(1.1,2.2),C2=(2.3,3.5) 计算每个数据点到两个中心点的距离，并将其划分到距离最近的类中。假设我们使用欧氏距离：

计算每个数据点到两个中心点的距离:

将每个数据点划分到距离最近的类中。这里我们用1和2表示两个类: C={1,2,1,1,2,2,2,2,2}
更新类中心点的坐标，即计算每个类的均值： C1=((1+2+3)/3,(2+1+1)/3)≈（2,1.3） C2=((2+2+3+4+1+4)/6,(3+4+5+3+5+2)/6))≈（2.6,3.6）
新的中心点更新为（2,1.3）和（2.6,3.6）
依次迭代直到发现没有重新分配或者准则函数收敛程序结束