KMeans、KNN、Mean-shift
无监督学习
机器学习方法的一种,没有给出事先标记过的训练数据,根据输入自动分类或分群。
优点:算法不受监督信息(偏见)的约束,可能考虑到新的信息。
不要标签数据,极大程度扩大数据样本。
主要应用:聚类分析、关联规则、维度缩减
应用最广:聚类分析
聚类分析:根据对象属性中的某些相似度,将其化为不同的类别。
KMeans聚类:
1、根据数据与中心点距离划分类别
2、根据类别数据更新中心点
3、重复过程直到收敛
特点:
1、实现简单、收敛快
2、需要指定类别数量
Mean-shift(均值漂移)
1、在中心点的一定区域内检索数据点
2、更新中心
3、重复流程到中心点稳定(我理解是中心点周边数据点最多)
特点:
1、自动发现类别数量,无需人工选定。
2、需要选择区域半径。
DBSCAN算法
1、基于区域点密度筛选有效数据
2、基于有效数据向空间扩展,知道没有新点加入
=================================================
continue......