轮廓系数做聚类,枚举

from sklearn.cluster import KMeans

from sklearn.metrics import silhouette_score

import numpy as np

X = your_embedding_or_pca_array # shape = (N, D)

best_k = None

best_score = -1

scores = []

for k in range(2, 15):

kmeans = KMeans(n_clusters=k, random_state=42)

labels = kmeans.fit_predict(X)

score = silhouette_score(X, labels)

scores.append(score)

if score > best_score:

best_score = score

best_k = k

print(f"最佳 k = {best_k}, 得分 = {best_score:.4f}")

可视化轮廓系数随 k 的变化

import matplotlib.pyplot as plt

plt.plot(range(2, 15), scores, marker='o')

plt.title("Silhouette Score vs K")

plt.xlabel("K")

plt.ylabel("Silhouette Score")

plt.grid(True)

plt.show()

相关推荐
Coisinilove3 分钟前
机器学习——线性回归
python·机器学习·线性回归
电科一班林耿超4 分钟前
机器学习大师课 第 1 课:什么是机器学习?写出你的第一个 AI 程序
人工智能·机器学习
一只数据集5 分钟前
水稻叶片图像与SPAD值标注数据集-140张高质量图像-精准农业机器学习训练数据集
人工智能·深度学习·机器学习
数据牧羊人的成长笔记5 分钟前
SVM与朴素贝叶斯算法+Kaggle竞赛+智能推荐系统+关联规则分析与Apriori算法+Gensim与LDA主题模型
算法·机器学习·支持向量机
zs宝来了11 分钟前
Ray 分布式计算:Actor 模型与任务调度
机器学习·ai·基础设施
数据牧羊人的成长笔记16 分钟前
分类算法的评价+KMeans聚类与降维算法+决策树与集成学习
人工智能·分类·数据挖掘
十三画者20 分钟前
【文献分享】MicroProphet一种具有时间感知能力的机器学习框架能够以个性化的方式精确预测微生物群落的动态变化
人工智能·机器学习·数据分析
steven_yzx39 分钟前
Fusion 分类和特点
人工智能·分类·数据挖掘
萌新小码农‍1 小时前
人工智能线性代数基础
人工智能·线性代数·机器学习
my1_1my1 小时前
AD-MT
人工智能·机器学习·机器翻译