k均值算法 聚类算法 k-means

首先我们导入科学计算的库

python 复制代码
import numpy as np
import matplotlib.pyplot as plt

直接我们生成一组数据,为了保证每次的数据是一致的,我们设置一个随机种子。

python 复制代码
np.random.seed(0)
X=np.random.rand(100,2)
print(X)

结果

然后我们就要开始写K-means算法

写一个模块函数

python 复制代码
def k_means(X,K,max_iters=100):
    #随机选择k个初始中心
    centroids=X[np.random.choice(X.shape[0],K,replace=False)]
#X.shape[0]告诉np.random.choice函数需要从0到数据点总数之间随机选择索引。
#K是指选择几个 replace指选择不重复的 然后用np.random.choice函数来从X里面选择几个不重复的
    
    for _ in range(max_iters):
    #1.分配每个数据点到最近的中心
        distances=np.linalg.norm(X[:,np.newaxis]-centroids,axis=2)#计算距离
        labels=np.argmin(distances,axis=1)#分配标签
                #2.更新中心
        new_centroids=np.array([X[labels==k].mean(axis=0) for k in range(K)])


        #如果中心不再变化,则停止
        if np.all(centroids==new_centroids):
            break
        centroids=new_centroids
    return labels,centroids
        
python 复制代码
K=3 #簇的数量
labels,centroids=k_means(X,K)

设置一下簇的数量,k-means算法每次都要设置k值

然后把最后的中心点和分类后的数据用matplotlib画出来

python 复制代码
plt.scatter(X[:,0],X[:,1],c=labels,cmap='viridis',marker='o')#绘制数据点
plt.scatter(centroids[:,0],centroids[:,1],c='red',marker='x',s=200)#绘制中心点
plt.title('k-means Clustering')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.show()
相关推荐
小码农<^_^>31 分钟前
优选算法精品课--滑动窗口算法(一)
算法
羊小猪~~33 分钟前
神经网络基础--什么是正向传播??什么是方向传播??
人工智能·pytorch·python·深度学习·神经网络·算法·机器学习
软工菜鸡1 小时前
预训练语言模型BERT——PaddleNLP中的预训练模型
大数据·人工智能·深度学习·算法·语言模型·自然语言处理·bert
南宫生1 小时前
贪心算法习题其三【力扣】【算法学习day.20】
java·数据结构·学习·算法·leetcode·贪心算法
AI视觉网奇1 小时前
sklearn 安装使用笔记
人工智能·算法·sklearn
JingHongB2 小时前
代码随想录算法训练营Day55 | 图论理论基础、深度优先搜索理论基础、卡玛网 98.所有可达路径、797. 所有可能的路径、广度优先搜索理论基础
算法·深度优先·图论
weixin_432702262 小时前
代码随想录算法训练营第五十五天|图论理论基础
数据结构·python·算法·深度优先·图论
小冉在学习2 小时前
day52 图论章节刷题Part04(110.字符串接龙、105.有向图的完全可达性、106.岛屿的周长 )
算法·深度优先·图论
Repeat7152 小时前
图论基础--孤岛系列
算法·深度优先·广度优先·图论基础
小冉在学习2 小时前
day53 图论章节刷题Part05(并查集理论基础、寻找存在的路径)
java·算法·图论