K-Means和KNN

Quinn-ntmy2023-10-26 9:24

主要区别

从无序 ---> 有序

从K-Means ---> KNN

KNN：监督学习，类别是已知的，对已知分类的数据进行训练和学习，找到不同类的特征，再对未分类的数据进行分类。
K-Means：无监督学习，事先不知道数据有几类，通过聚类分析将数据聚合成几个群体。聚类不需要对数据进行训练和学习。

KNN

原理

将预测点与所有点的距离进行计算，然后保存并排序，选出前面K个值看看哪些类别比较多，则预测的点就属于哪一类。

KNN也可以用于回归预测

算法步骤

对未知类别属性的数据集中每个点依次执行以下操作：

计算已知类别数据集中的点与当前点之间的距离；
通常使用的是欧氏距离
按照距离递增次序排序；
选取与当前点距离最小的k个点；
如何确定k？
通过交叉验证，从选取一个较小的k值开始，不断增加k的值，然后计算验证集合的方差，最终找到一个比较合适的k值。
确定前k个点所在类别的出现频率；
返回前k个点出现频率最高的类别作为当前点的预测分类。

K-Means

原理

随机选取质心------计算各样本点和质心的距离后分类------再次选择新的质心

【扩展】

邻近度函数（即距离计算）：

（1）曼哈顿距离：质心------中位数，目标函数------最小化对象到簇质心的距离和；

（2）平方欧几里得距离：质心------均值，目标函数------最小化对象到簇质心的距离的平方和；

（3）余弦距离：质心------均值，目标函数------最大化对象与其质心的余弦相似度和；

（4）Bregman散度：质心------均值，目标函数------最小化对象到簇质心的Bregman散度和。

算法步骤

随机选取k个质心（k值取决于想聚成几类）；
计算样本到质心的距离，距离质心近的归为一类，分为k类；
求出分类后的每类的新质心；
再次计算样本到新质心的距离，距离质心距离近的归为一类；
判断新旧聚类是否相同，如果相同就代表已经聚类成功，如果没有则循环2-4。

上一篇：RabbitMQ中方法channel.basicAck的使用说明

下一篇：RabbitMQ高级篇笔记

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03OpenClaw 连接飞书完整指南：插件安装、配置与踩坑记录 04本地部署 OpenClaw + DeepSeek-R1 完全指南 05Window 10部署openclaw报错node.exe : npm error code 128 06OpenClaw + 飞书（Feishu）环境搭建指南 07npm-error code 128问题解决方法 08OpenClaw 飞书机器人不回复消息？3 小时踩坑总结 09Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 10Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services