轮廓系数做聚类,枚举

from sklearn.cluster import KMeans

from sklearn.metrics import silhouette_score

import numpy as np

X = your_embedding_or_pca_array # shape = (N, D)

best_k = None

best_score = -1

scores = []

for k in range(2, 15):

kmeans = KMeans(n_clusters=k, random_state=42)

labels = kmeans.fit_predict(X)

score = silhouette_score(X, labels)

scores.append(score)

if score > best_score:

best_score = score

best_k = k

print(f"最佳 k = {best_k}, 得分 = {best_score:.4f}")

可视化轮廓系数随 k 的变化

import matplotlib.pyplot as plt

plt.plot(range(2, 15), scores, marker='o')

plt.title("Silhouette Score vs K")

plt.xlabel("K")

plt.ylabel("Silhouette Score")

plt.grid(True)

plt.show()

相关推荐
Dovis(誓平步青云)2 分钟前
智能推理DeepSeek-R1+Word深度整合业级智能办公构建
人工智能·深度学习·机器学习·语言模型·数据挖掘·word
归去_来兮7 小时前
LightGBM算法原理及Python实现
人工智能·机器学习·集成学习·lightgbm
IT古董10 小时前
【漫话机器学习系列】234.阈值类特征的方差分析(Thresholding Categorical Feature Variance)
人工智能·python·机器学习
xiaohanbao0912 小时前
day16 numpy和shap深入理解
python·学习·机器学习·信息可视化·numpy·pandas
搏博14 小时前
神经网络在专家系统中的应用:从符号逻辑到连接主义的融合创新
人工智能·深度学习·神经网络·算法·机器学习
feng9952015 小时前
从巴别塔到通天塔:Manus AI 如何重构多语言手写识别的智能版图
大数据·人工智能·机器学习
Echo``15 小时前
19:常见的Halcon数据格式
java·linux·图像处理·人工智能·windows·机器学习·视觉检测
xiaoli232717 小时前
机器学习朴素贝叶斯算法
人工智能·算法·机器学习
天天爱吃肉821818 小时前
机器学习项目流程极简入门:从数据到部署的完整指南
人工智能·机器学习
xiangzhihong820 小时前
DeepSeek-Prover-V2,DeepSeek推出的开源数学推理大模型
人工智能·深度学习·机器学习