机器学习基础之《分类算法(2)—K-近邻算法》

一、K-近邻算法(KNN)

1、定义

KNN

K:就是一个自然数

N:nearest,最近的

N:neighbourhood,邻居

如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别

k = 1 容易受到异常点的影响

2、假设有一张北京地图,我不知道我在哪儿,目的是要知道我在北京的哪个区

这是一个分类问题

我不知道我在哪儿,但我知道我跟这几个人之间的距离,并且知道这5个人在哪个区

KNN核心思想:你的"邻居"来推断出你的类别

3、计算距离公式

两个样本的距离可以通过如下公式计算,又叫欧式距离

注意:二维空间则是d = sqrt((x2 - x1)^2 + (y2 - y1)^2)

其他距离公式:

曼哈顿距离---绝对值距离

闵可夫斯基距离

4、例子

相关推荐
Dev7z2 小时前
基于计算机视觉与机器学习的课堂坐姿智能监测与预警系统
人工智能·机器学习·计算机视觉
长不大的蜡笔小新3 小时前
从0到1学AlexNet:用经典网络搞定花分类任务
图像处理·深度学习·机器学习
sensen_kiss4 小时前
INT305 Machine Learning 机器学习 Pt.9 Probabilistic Models(概率模型)
人工智能·机器学习·概率论
tech-share4 小时前
基于pytorch 自建AI大模型
人工智能·深度学习·机器学习·gpu算力
ekprada5 小时前
DAY 16 数组的常见操作和形状
人工智能·python·机器学习
后端小张9 小时前
【AI 解析】Gemini 3 全面解析:从认知到落地
人工智能·机器学习·ai·语言模型·chatgpt·imagen·gemini
AI大模型学徒9 小时前
NLP基础(八)_马尔可夫模型
算法·机器学习·自然语言处理·nlp·概率论·马尔可夫模型
limenga10210 小时前
奇异值分解(SVD):深度理解神经网络的内在结构
人工智能·深度学习·神经网络·机器学习
秋邱10 小时前
【机器学习】深入解析线性回归模型
人工智能·机器学习·线性回归
●VON10 小时前
人工智能、机器学习与深度学习:从概念到实践
人工智能·深度学习·机器学习