聚类模型评估指标

聚类模型评估指标-轮廓系数

  1. 计算样本i到同簇其它样本到平均距离ai,ai越小,说明样本i越应该被聚类到该簇(将ai称为样本i到簇内不相似度);
  2. 计算样本i到其它某簇Cj的所有样本的平均距离bij,称为样本i与簇Cj的不相似度。定义为样本i的簇间不相似度:bi=min(bi1,bi2,...,bik2);
    说明:
    • si接近1,则说明样本i聚类合理;
    • si接近-1,则说明样本i更应该分类到另外的簇;
    若si近似为0,则说明样本i在两个簇的边界上;
相关推荐
数据猎手小k2 天前
PCBS:由麻省理工学院和Google联合创建,揭示1.2M短文本间的相似性的大规模图聚类数据集。
机器学习·支持向量机·数据集·聚类·机器学习数据集·ai大模型应用
汤姆和佩琦2 天前
2024-11-16-机器学习方法:无监督学习(1) 聚类(上)
人工智能·笔记·学习·机器学习·聚类·无监督学习
秀儿还能再秀2 天前
DBSCAN聚类——基于密度的聚类算法(常用的聚类算法)
机器学习·学习笔记·聚类·dbscan
行码棋3 天前
【机器学习】聚类算法原理详解
算法·机器学习·聚类
行然梦实6 天前
学习日记_20241115_聚类方法(层次聚类)
学习·聚类
C7211BA7 天前
使用 DBSCAN(基于密度的聚类算法) 对二维数据进行聚类分析
算法·数据挖掘·聚类
行然梦实8 天前
学习日记_20241110_聚类方法(K-Means)
学习·kmeans·聚类
goomind8 天前
YOLOv11实战宠物狗分类
人工智能·yolo·机器学习·计算机视觉·分类·聚类
路径规划66611 天前
船舶AIS轨迹聚类算法(附python源码)
算法·数据挖掘·聚类
卡卡_R-Python12 天前
系统聚类的分类数确定——聚合系数法
分类·数据挖掘·聚类