机器学习基础之《分类算法(2)—K-近邻算法》

一、K-近邻算法(KNN)

1、定义

KNN

K:就是一个自然数

N:nearest,最近的

N:neighbourhood,邻居

如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别

k = 1 容易受到异常点的影响

2、假设有一张北京地图,我不知道我在哪儿,目的是要知道我在北京的哪个区

这是一个分类问题

我不知道我在哪儿,但我知道我跟这几个人之间的距离,并且知道这5个人在哪个区

KNN核心思想:你的"邻居"来推断出你的类别

3、计算距离公式

两个样本的距离可以通过如下公式计算,又叫欧式距离

注意:二维空间则是d = sqrt((x2 - x1)^2 + (y2 - y1)^2)

其他距离公式:

曼哈顿距离---绝对值距离

闵可夫斯基距离

4、例子

相关推荐
哥布林学者1 天前
高光谱成像(五)高光谱成像的噪声估计
机器学习·高光谱成像
哥布林学者4 天前
高光谱成像(四)最小噪声分数变换 MNF
机器学习·高光谱成像
哥布林学者5 天前
高光谱成像(三)主成分分析 PCA
机器学习·高光谱成像
OpenBayes贝式计算5 天前
边看、边听、边说,MiniCPM-0-4.5 全双工全模态模型;Pan-Cancer scRNA-Seq 涵盖三种生物学状态单细胞转录数据集
人工智能·深度学习·机器学习
OpenBayes贝式计算5 天前
教程上新丨基于500万小时语音数据,Qwen3-TTS实现3秒语音克隆及精细调控
人工智能·深度学习·机器学习
小黎14757789853647 天前
OpenClaw 连接飞书完整指南:插件安装、配置与踩坑记录
机器学习
哥布林学者7 天前
高光谱成像(二)光谱角映射 SAM
机器学习·高光谱成像
哥布林学者8 天前
高光谱成像(一)高光谱图像
机器学习·高光谱成像