C均值算法例子

有如下数据,试使用C-均值聚类将该数据集聚为2类。初始聚类中心为P1和P2,写出计算过程。

坐标点 X Y
P1 0 0
P2 1 2
P3 3 1
P4 8 8
P5 9 9
P6 10 7

解:6个点聚离P1,P2的距离分别如下:

( 0 , 5 , 10 , 8 2 , 9 2 , 149 (0, \sqrt 5,\sqrt {10}, 8\sqrt 2, 9\sqrt2,\sqrt {149} (0,5 ,10 ,82 ,92 ,149

( 5 , 0 , 5 , 85 , 113 , 106 ) (\sqrt 5,0, \sqrt {5}, \sqrt {85}, \sqrt{113},\sqrt {106}) (5 ,0,5 ,85 ,113 ,106 )

可见P3,P4,P5和P6与P2是一个聚类,P1单独是一个聚类。P1的聚类中心是(0,0),P2,P3,P4,P5,P6的聚类中心是:
1 + 3 + 8 + 9 + 10 5 = 31 5 = 6.2 \frac{1+3+8+9+10}{5} = \frac{31}{5} = 6.2 51+3+8+9+10=531=6.2
2 + 1 + 8 + 9 + 7 5 = 27 5 = 5.4 \frac{2+1+8+9+7}{5} = \frac{27}{5} = 5.4 52+1+8+9+7=527=5.4

第二轮聚类,6点聚类聚类中心的距离分别为:

( 0 , 2.24 , 3.16 , 11.3 , 12.73 , 12.2 ) (0,2.24,3.16,11.3,12.73,12.2) (0,2.24,3.16,11.3,12.73,12.2)

( 8.22 , 6.21 , 5.44 , 3.16 , 4.56 , 4.12 ) (8.22,6.21,5.44,3.16,4.56,4.12) (8.22,6.21,5.44,3.16,4.56,4.12)

新的聚类为:P1,P2,P3和P4,P5,P6。新的聚类中心是:
1 + 3 3 = 4 3 = 1.33 \frac{1+3}{3} = \frac{4}{3} = 1.33 31+3=34=1.33
1 + 2 3 = 3 3 = 1 \frac{1+2}{3} = \frac{3}{3} = 1 31+2=33=1
8 + 9 + 10 3 = 27 3 = 9 \frac{8+9+10}{3} = \frac{27}{3} = 9 38+9+10=327=9
7 + 8 + 9 3 = 24 3 = 8 \frac{7+8+9}{3} = \frac{24}{3} = 8 37+8+9=324=8

第三轮聚类,6点聚类聚类中心的距离分别为:

( 1.66 , 1.05 , 1.67 , 9.67 , 11.08 , 10.54 ) (1.66,1.05,1.67,9.67,11.08,10.54) (1.66,1.05,1.67,9.67,11.08,10.54)

( 12.04 , 10.00 , 9.22 , 1.00 , 1.00 , 1.41 ) (12.04,10.00,9.22,1.00,1.00,1.41) (12.04,10.00,9.22,1.00,1.00,1.41)

新的聚类中心是(1.33,1)和(9,8),新的聚类结果是P1,P2,P3和P4,P5,P6。聚类结束。

相关推荐
知来者逆19 分钟前
研究大语言模型在心理保健智能顾问的有效性和挑战
人工智能·神经网络·机器学习·语言模型·自然语言处理
老艾的AI世界41 分钟前
新一代AI换脸更自然,DeepLiveCam下载介绍(可直播)
图像处理·人工智能·深度学习·神经网络·目标检测·机器学习·ai换脸·视频换脸·直播换脸·图片换脸
Chef_Chen2 小时前
从0开始学习机器学习--Day14--如何优化神经网络的代价函数
神经网络·学习·机器学习
AI街潜水的八角3 小时前
基于C++的决策树C4.5机器学习算法(不调包)
c++·算法·决策树·机器学习
喵~来学编程啦3 小时前
【论文精读】LPT: Long-tailed prompt tuning for image classification
人工智能·深度学习·机器学习·计算机视觉·论文笔记
Chef_Chen5 小时前
从0开始学习机器学习--Day13--神经网络如何处理复杂非线性函数
神经网络·学习·机器学习
Troc_wangpeng5 小时前
R language 关于二维平面直角坐标系的制作
开发语言·机器学习
-Nemophilist-5 小时前
机器学习与深度学习-1-线性回归从零开始实现
深度学习·机器学习·线性回归
艾派森6 小时前
大数据分析案例-基于随机森林算法的智能手机价格预测模型
人工智能·python·随机森林·机器学习·数据挖掘
7 小时前
开源竞争-数据驱动成长-11/05-大专生的思考
人工智能·笔记·学习·算法·机器学习