K-Means算法进行分类

已知数据集D中有9个数据点,分别是(1,2),(2,3), (2,1), (3,1),(2,4),(3,5),(4,3),(1,5),(4,2)。采用K-Means算法进行聚类,k=2,设初始中心点为(1.1,2.2),(2.3,3.5)。 试模拟K-Means算法的一次迭代过程,即先计算样本点到类中心点的距离,然后把样本点划分到最近的类中,最后更新类中心点的坐标


数据集合D:{(1,2),(2,3),(2,1),(3,1),(2,4),(3,5),(4,3),(1,5),(4,2)} 初始中心点: C1=(1.1,2.2),C2=(2.3,3.5) 计算每个数据点到两个中心点的距离,并将其划分到距离最近的类中。假设我们使用欧氏距离:

计算每个数据点到两个中心点的距离:

将每个数据点划分到距离最近的类中。这里我们用1和2表示两个类: C={1,2,1,1,2,2,2,2,2}
更新类中心点的坐标,即计算每个类的均值: C1=((1+2+3)/3,(2+1+1)/3)≈(2,1.3) C2=((2+2+3+4+1+4)/6,(3+4+5+3+5+2)/6))≈(2.6,3.6)
新的中心点更新为(2,1.3)和(2.6,3.6)
依次迭代直到发现没有重新分配或者准则函数收敛程序结束

相关推荐
人邮异步社区36 分钟前
PRML为何是机器学习的经典书籍中的经典?
人工智能·机器学习
xiangzhihong81 小时前
使用 Trae IDE 一键将 Figma 转为前端代码
机器学习
Coding茶水间1 小时前
基于深度学习的反光衣检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
图像处理·人工智能·深度学习·yolo·目标检测·机器学习·计算机视觉
露临霜2 小时前
重启机器学习
人工智能·机器学习
CappuccinoRose2 小时前
均值向量的检验
机器学习·均值向量·均值向量的检验·多元均值向量的检验
qq_433554543 小时前
C++数位DP
c++·算法·图论
AshinGau3 小时前
Softmax 与 交叉熵损失
神经网络·算法
似水এ᭄往昔3 小时前
【C++】--AVL树的认识和实现
开发语言·数据结构·c++·算法·stl
栀秋6663 小时前
“无重复字符的最长子串”:从O(n²)哈希优化到滑动窗口封神,再到DP降维打击!
前端·javascript·算法
xhxxx3 小时前
不用 Set,只用两个布尔值:如何用标志位将矩阵置零的空间复杂度压到 O(1)
javascript·算法·面试