轮廓系数做聚类,枚举

from sklearn.cluster import KMeans

from sklearn.metrics import silhouette_score

import numpy as np

X = your_embedding_or_pca_array # shape = (N, D)

best_k = None

best_score = -1

scores = []

for k in range(2, 15):

kmeans = KMeans(n_clusters=k, random_state=42)

labels = kmeans.fit_predict(X)

score = silhouette_score(X, labels)

scores.append(score)

if score > best_score:

best_score = score

best_k = k

print(f"最佳 k = {best_k}, 得分 = {best_score:.4f}")

可视化轮廓系数随 k 的变化

import matplotlib.pyplot as plt

plt.plot(range(2, 15), scores, marker='o')

plt.title("Silhouette Score vs K")

plt.xlabel("K")

plt.ylabel("Silhouette Score")

plt.grid(True)

plt.show()

相关推荐
热心网友俣先生32 分钟前
2025年泰迪杯数据挖掘竞赛B题论文首发+问题一二三四代码分享
人工智能·数据挖掘
zy_destiny1 小时前
【非机动车检测】用YOLOv8实现非机动车及驾驶人佩戴安全帽检测
人工智能·python·算法·yolo·机器学习·安全帽·非机动车
派可数据BI可视化1 小时前
数据中台、BI业务访谈(三):如何选择合适的访谈对象
大数据·信息可视化·数据挖掘·数据分析·商业智能bi
AI糊涂是福1 小时前
数字政府与智慧城市区别报告分析
大数据·人工智能·机器学习·架构·智慧城市
大神薯条老师3 小时前
Python高级爬虫之JS逆向+安卓逆向1.4节:数据运算
爬虫·python·机器学习·数据分析·网络爬虫
潇湘馆记4 小时前
集成学习介绍
机器学习·集成学习
蹦蹦跳跳真可爱5896 小时前
Python----机器学习(基于PyTorch的垃圾邮件逻辑回归)
人工智能·pytorch·python·机器学习·逻辑回归
乙真仙人6 小时前
数据分析不只是跑个SQL!
sql·数据挖掘·数据分析
奋斗者1号7 小时前
机器学习中的分类算法与数据处理实践:从理论到应用
人工智能·机器学习·分类
不爱吃于先生7 小时前
机器学习概述自用笔记(李宏毅)
人工智能·笔记·机器学习