C均值算法例子

有如下数据,试使用C-均值聚类将该数据集聚为2类。初始聚类中心为P1和P2,写出计算过程。

坐标点 X Y
P1 0 0
P2 1 2
P3 3 1
P4 8 8
P5 9 9
P6 10 7

解:6个点聚离P1,P2的距离分别如下:

( 0 , 5 , 10 , 8 2 , 9 2 , 149 (0, \sqrt 5,\sqrt {10}, 8\sqrt 2, 9\sqrt2,\sqrt {149} (0,5 ,10 ,82 ,92 ,149

( 5 , 0 , 5 , 85 , 113 , 106 ) (\sqrt 5,0, \sqrt {5}, \sqrt {85}, \sqrt{113},\sqrt {106}) (5 ,0,5 ,85 ,113 ,106 )

可见P3,P4,P5和P6与P2是一个聚类,P1单独是一个聚类。P1的聚类中心是(0,0),P2,P3,P4,P5,P6的聚类中心是:
1 + 3 + 8 + 9 + 10 5 = 31 5 = 6.2 \frac{1+3+8+9+10}{5} = \frac{31}{5} = 6.2 51+3+8+9+10=531=6.2
2 + 1 + 8 + 9 + 7 5 = 27 5 = 5.4 \frac{2+1+8+9+7}{5} = \frac{27}{5} = 5.4 52+1+8+9+7=527=5.4

第二轮聚类,6点聚类聚类中心的距离分别为:

( 0 , 2.24 , 3.16 , 11.3 , 12.73 , 12.2 ) (0,2.24,3.16,11.3,12.73,12.2) (0,2.24,3.16,11.3,12.73,12.2)

( 8.22 , 6.21 , 5.44 , 3.16 , 4.56 , 4.12 ) (8.22,6.21,5.44,3.16,4.56,4.12) (8.22,6.21,5.44,3.16,4.56,4.12)

新的聚类为:P1,P2,P3和P4,P5,P6。新的聚类中心是:
1 + 3 3 = 4 3 = 1.33 \frac{1+3}{3} = \frac{4}{3} = 1.33 31+3=34=1.33
1 + 2 3 = 3 3 = 1 \frac{1+2}{3} = \frac{3}{3} = 1 31+2=33=1
8 + 9 + 10 3 = 27 3 = 9 \frac{8+9+10}{3} = \frac{27}{3} = 9 38+9+10=327=9
7 + 8 + 9 3 = 24 3 = 8 \frac{7+8+9}{3} = \frac{24}{3} = 8 37+8+9=324=8

第三轮聚类,6点聚类聚类中心的距离分别为:

( 1.66 , 1.05 , 1.67 , 9.67 , 11.08 , 10.54 ) (1.66,1.05,1.67,9.67,11.08,10.54) (1.66,1.05,1.67,9.67,11.08,10.54)

( 12.04 , 10.00 , 9.22 , 1.00 , 1.00 , 1.41 ) (12.04,10.00,9.22,1.00,1.00,1.41) (12.04,10.00,9.22,1.00,1.00,1.41)

新的聚类中心是(1.33,1)和(9,8),新的聚类结果是P1,P2,P3和P4,P5,P6。聚类结束。

相关推荐
数据科学作家13 小时前
学数据分析必囤!数据分析必看!清华社9本书覆盖Stata/SPSS/Python全阶段学习路径
人工智能·python·机器学习·数据分析·统计·stata·spss
java1234_小锋15 小时前
Scikit-learn Python机器学习 - 特征预处理 - 标准化 (Standardization):StandardScaler
python·机器学习·scikit-learn
xz2024102****19 小时前
吴恩达机器学习合集
人工智能·机器学习
anneCoder19 小时前
AI大模型应用研发工程师面试知识准备目录
人工智能·深度学习·机器学习
空白到白19 小时前
机器学习-决策树
人工智能·决策树·机器学习
纪东东20 小时前
机器学习——使用K近邻算法实现一个识别手写数字系统
人工智能·机器学习·近邻算法
THMAIL20 小时前
机器学习从入门到精通 - 数据预处理实战秘籍:清洗、转换与特征工程入门
人工智能·python·算法·机器学习·数据挖掘·逻辑回归
Moutai码农20 小时前
1.5、机器学习-回归算法
人工智能·机器学习·回归
非门由也21 小时前
《sklearn机器学习——绘制分数以评估模型》验证曲线、学习曲线
人工智能·机器学习·sklearn
THMAIL21 小时前
深度学习从入门到精通 - AutoML与神经网络搜索(NAS):自动化模型设计未来
人工智能·python·深度学习·神经网络·算法·机器学习·逻辑回归