轮廓系数做聚类,枚举

from sklearn.cluster import KMeans

from sklearn.metrics import silhouette_score

import numpy as np

X = your_embedding_or_pca_array # shape = (N, D)

best_k = None

best_score = -1

scores = []

for k in range(2, 15):

kmeans = KMeans(n_clusters=k, random_state=42)

labels = kmeans.fit_predict(X)

score = silhouette_score(X, labels)

scores.append(score)

if score > best_score:

best_score = score

best_k = k

print(f"最佳 k = {best_k}, 得分 = {best_score:.4f}")

可视化轮廓系数随 k 的变化

import matplotlib.pyplot as plt

plt.plot(range(2, 15), scores, marker='o')

plt.title("Silhouette Score vs K")

plt.xlabel("K")

plt.ylabel("Silhouette Score")

plt.grid(True)

plt.show()

相关推荐
第六五2 分钟前
DPC和DPC-KNN算法
人工智能·算法·机器学习
龙俊杰的读书笔记27 分钟前
《小白学随机过程》第一章:随机过程——定义和形式 (附录1 探究随机变量)
人工智能·机器学习·概率论·随机过程和rl
wearegogog1231 小时前
负荷聚类及其在MATLAB中的实现
matlab·php·聚类
Blossom.1181 小时前
把 AI“缝”进布里:生成式编织神经网络让布料自带摄像头
人工智能·python·单片机·深度学习·神经网络·目标检测·机器学习
koo3643 小时前
李宏毅机器学习笔记27
人工智能·笔记·机器学习
茗创科技3 小时前
Annals of Neurology | EEG‘藏宝图’:用于脑电分类、聚类与预测的语义化低维流形
分类·数据挖掘·聚类
weixin_377634843 小时前
【强化学习】RLMT强制 CoT提升训练效果
人工智能·算法·机器学习
材料科学研究3 小时前
固态电池AI设计:从DFT到机器学习!!!
机器学习·电池·固态电池·电池健康·高通量计算·电池寿命
渡我白衣4 小时前
《未来的 AI 操作系统(四)——AgentOS 的内核设计:调度、记忆与自我反思机制》
人工智能·深度学习·机器学习·语言模型·数据挖掘·人机交互·语音识别
he___H4 小时前
Kaggle机器学习初级的三种决策树
决策树·机器学习