1.是什么?
无监督式学习与监督式学习**最大的区别就是:**没有事先给定的训练实例,它是自动对输入的示例进行分类或者分群;
优点:不需要标签数据,极大程度上扩大了我们的数据样本,其次不受监督信息的偏见,可能考虑到新的信息 ;
**关联规则:**根据输入的数据得到他们之间的关联
**纬度缩减:**数据之间可能存在一定的关系,然后我们可以进行降维,加快数据运算速度
2.应用:聚类分析
2.1是什么:
根据对象属性的相似度,将其分为不同的类别;(客户分析,基因聚类,新闻关联)
2.2 Kmeans算法
首先要告诉计算机你需要分成几类,然后他会根据中心点计算数据的距离,然后进行分类;
2.4 MeanShift均值漂移聚类
需要定义半径,中心区域半径内会不断聚集周围的节点,直至形成类别(自动发现类别)
2.5 DBSCAN算法
基于密度的空间聚类算法
特点: 1.基于密度 中心点进行扩张来筛选出有效数据,如果密度比较低 的话,这些数据就会过滤掉**(过滤噪声)** 2.然后基于密度符合的有效数据进行周围的扩招直至不满足条件