k均值算法 聚类算法 k-means

首先我们导入科学计算的库

python 复制代码
import numpy as np
import matplotlib.pyplot as plt

直接我们生成一组数据,为了保证每次的数据是一致的,我们设置一个随机种子。

python 复制代码
np.random.seed(0)
X=np.random.rand(100,2)
print(X)

结果

然后我们就要开始写K-means算法

写一个模块函数

python 复制代码
def k_means(X,K,max_iters=100):
    #随机选择k个初始中心
    centroids=X[np.random.choice(X.shape[0],K,replace=False)]
#X.shape[0]告诉np.random.choice函数需要从0到数据点总数之间随机选择索引。
#K是指选择几个 replace指选择不重复的 然后用np.random.choice函数来从X里面选择几个不重复的
    
    for _ in range(max_iters):
    #1.分配每个数据点到最近的中心
        distances=np.linalg.norm(X[:,np.newaxis]-centroids,axis=2)#计算距离
        labels=np.argmin(distances,axis=1)#分配标签
                #2.更新中心
        new_centroids=np.array([X[labels==k].mean(axis=0) for k in range(K)])


        #如果中心不再变化,则停止
        if np.all(centroids==new_centroids):
            break
        centroids=new_centroids
    return labels,centroids
        
python 复制代码
K=3 #簇的数量
labels,centroids=k_means(X,K)

设置一下簇的数量,k-means算法每次都要设置k值

然后把最后的中心点和分类后的数据用matplotlib画出来

python 复制代码
plt.scatter(X[:,0],X[:,1],c=labels,cmap='viridis',marker='o')#绘制数据点
plt.scatter(centroids[:,0],centroids[:,1],c='red',marker='x',s=200)#绘制中心点
plt.title('k-means Clustering')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.show()
相关推荐
头发够用的程序员31 分钟前
从滑动窗口到矩阵运算:img2col算法基本原理
人工智能·算法·yolo·性能优化·矩阵·边缘计算·jetson
武帝为此1 小时前
【数据清洗缺失值处理】
python·算法·数学建模
Halo_tjn2 小时前
Java 基于字符串相关知识点
java·开发语言·算法
念越2 小时前
算法每日一题 Day08|双指针法解决三数之和
算法·力扣
黎阳之光2 小时前
黎阳之光透明管理:视频孪生重构智慧仓储新范式
人工智能·算法·安全·重构·数字孪生
CappuccinoRose3 小时前
回溯法 - 软考备战(四十三)
算法·排列组合·路径·n皇后·子集·解数独·岛屿
AC赳赳老秦3 小时前
OpenClaw进阶技巧:批量修改文件内容、替换关键词,解放双手
java·linux·人工智能·python·算法·测试用例·openclaw
Robot_Nav4 小时前
Shape-Aware MPPI(SA MPPI)算法:基于RC-ESDF的任意形状机器人实时轨迹优化
算法·机器人·sa-mppi
小O的算法实验室5 小时前
2026年ESWA,自适应基于排序的协同进化学习粒子群算法+边缘计算服务器部署,深度解析+性能实测
算法·论文复现·智能算法·智能算法改进
cpp_25015 小时前
P1832 A+B Problem(再升级)
数据结构·c++·算法·动态规划·题解·洛谷·背包dp