一个使用Python和scikit-learn
库实现KMeans聚类算法的简单示例。首先,请确保您已经安装了scikit-learn
库。如果没有安装,可以通过pip安装它:
bash
pip install scikit-learn
下面是一个简单的例子,展示如何使用scikit-learn
中的KMeans进行数据聚类:
python
# 导入所需的库
import numpy as np
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt
# 生成模拟数据
X, _ = make_blobs(n_samples=300, centers=4, random_state=42)
# 初始化KMeans模型
kmeans = KMeans(n_clusters=4, random_state=42)
# 拟合数据
kmeans.fit(X)
# 预测数据点所属的簇
labels = kmeans.predict(X)
# 获取聚类中心
centers = kmeans.cluster_centers_
# 绘制结果
plt.scatter(X[:, 0], X[:, 1], c=labels, s=50, cmap='viridis')
plt.scatter(centers[:, 0], centers[:, 1], c='red', s=200, alpha=0.5)
plt.title('KMeans Clustering')
plt.show()
这段代码首先生成了一些模拟的数据点,然后使用KMeans算法对这些数据点进行聚类,并将结果可视化。在这个例子中,我们设定了四个聚类中心。