轮廓系数做聚类,枚举

from sklearn.cluster import KMeans

from sklearn.metrics import silhouette_score

import numpy as np

X = your_embedding_or_pca_array # shape = (N, D)

best_k = None

best_score = -1

scores = \[\]

for k in range(2, 15):

kmeans = KMeans(n_clusters=k, random_state=42)

labels = kmeans.fit_predict(X)

score = silhouette_score(X, labels)

scores.append(score)

if score > best_score:

best_score = score

best_k = k

print(f"最佳 k = {best_k}, 得分 = {best_score:.4f}")

可视化轮廓系数随 k 的变化

import matplotlib.pyplot as plt

plt.plot(range(2, 15), scores, marker='o')

plt.title("Silhouette Score vs K")

plt.xlabel("K")

plt.ylabel("Silhouette Score")

plt.grid(True)

plt.show()

相关推荐
tigershang28 分钟前
卡尔曼滤波:不确定世界中的最优估计
人工智能·算法·机器学习
深度之眼37 分钟前
2026年因果推断与多目标优化结合的前沿思路
机器学习·多目标优化·因果推断
人工智能培训1 小时前
七大数字技术协同赋能 开启全域智能数字化新时代
人工智能·深度学习·机器学习·生成对抗网络·知识图谱
郑洁文1 小时前
基于机器学习的成都市租房数据的分析与应用
人工智能·机器学习·成都市租房数据·成都市租房数据分析
哥布林学者1 小时前
深度学习进阶(二十九)现代 LLM 的核心架构设计其四:GQA
机器学习·ai
林间码客1 小时前
《人工智能概论》实验4 知识点复习提纲
人工智能·深度学习·机器学习
人工智能培训2 小时前
从GPT到开源大模型
人工智能·gpt·深度学习·机器学习·容器·知识图谱
红宝村村长2 小时前
OPD Reverse KL
机器学习
keykey6.3 小时前
LSTM 文本情感分析:从词嵌入到分类实战
开发语言·人工智能·深度学习·机器学习
数智工坊3 小时前
周志华《Machine Learning》学习笔记--第十三章--半监督学习
笔记·学习·机器学习