机器学习基础之《分类算法(2)—K-近邻算法》

一、K-近邻算法(KNN)

1、定义

KNN

K:就是一个自然数

N:nearest,最近的

N:neighbourhood,邻居

如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别

k = 1 容易受到异常点的影响

2、假设有一张北京地图,我不知道我在哪儿,目的是要知道我在北京的哪个区

这是一个分类问题

我不知道我在哪儿,但我知道我跟这几个人之间的距离,并且知道这5个人在哪个区

KNN核心思想:你的"邻居"来推断出你的类别

3、计算距离公式

两个样本的距离可以通过如下公式计算,又叫欧式距离

注意:二维空间则是d = sqrt((x2 - x1)^2 + (y2 - y1)^2)

其他距离公式:

曼哈顿距离---绝对值距离

闵可夫斯基距离

4、例子

相关推荐
Humbunklung17 分钟前
全连接层和卷积层
人工智能·python·深度学习·神经网络·机器学习·cnn
神经星星1 小时前
基于8.6万蛋白质结构数据,融合量子力学计算的机器学习方法挖掘69个全新氮-氧-硫键
人工智能·深度学习·机器学习
柠石榴2 小时前
《机器学习》(周志华)第一章 绪论
人工智能·机器学习
Dfreedom.3 小时前
过拟合和欠拟合
人工智能·机器学习
武乐乐~3 小时前
强化学习入门:交叉熵方法实现CartPole智能体
人工智能·深度学习·机器学习
音沐mu.3 小时前
【20】番茄叶片病害数据集(有v5/v8模型)/YOLO番茄叶片病害检测
人工智能·yolo·目标检测·机器学习·计算机视觉·番茄叶片病害检测·番茄叶片病害数据集
异常君3 小时前
Elasticsearch 与机器学习结合:实现高效模型推理的方案(上)
java·elasticsearch·机器学习
yunvwugua__3 小时前
Python训练营打卡 Day50
人工智能·深度学习·机器学习
异常君4 小时前
Elasticsearch 与机器学习结合:实现高效模型推理的方案(下)
java·elasticsearch·机器学习
Tadas-Gao4 小时前
从碳基羊驼到硅基LLaMA:开源大模型家族的生物隐喻与技术进化全景
人工智能·机器学习·大模型·llm·llama