机器学习基础之《分类算法(2)—K-近邻算法》

一、K-近邻算法(KNN)

1、定义

KNN

K:就是一个自然数

N:nearest,最近的

N:neighbourhood,邻居

如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别

k = 1 容易受到异常点的影响

2、假设有一张北京地图,我不知道我在哪儿,目的是要知道我在北京的哪个区

这是一个分类问题

我不知道我在哪儿,但我知道我跟这几个人之间的距离,并且知道这5个人在哪个区

KNN核心思想:你的"邻居"来推断出你的类别

3、计算距离公式

两个样本的距离可以通过如下公式计算,又叫欧式距离

注意:二维空间则是d = sqrt((x2 - x1)^2 + (y2 - y1)^2)

其他距离公式:

曼哈顿距离---绝对值距离

闵可夫斯基距离

4、例子

相关推荐
Jmayday10 小时前
机器学习基本理论
人工智能·机器学习
王_teacher10 小时前
机器学习 矩阵求导 完整公式+严谨推导
人工智能·线性代数·考研·机器学习·矩阵·线性回归
xiaotao13111 小时前
02-机器学习基础: 无监督学习——scikit-learn实战与模型管理
学习·机器学习·scikit-learn
xiaotao13115 小时前
03-深度学习基础:循环神经网络(RNN)
人工智能·深度学习·机器学习
小糖学代码16 小时前
LLM系列:2.pytorch入门:3.基本优化思想与最小二乘法
人工智能·python·算法·机器学习·ai·数据挖掘·最小二乘法
叶子丶苏16 小时前
第二节_机器学习基本知识点
人工智能·python·机器学习·数据科学
DeepModel17 小时前
特征缩放(标准化/归一化)超通俗讲解
机器学习
AI科技星18 小时前
基于螺旋元逻辑的宇宙统一场论底层公理构建(乖乖数学)
算法·机器学习·数学建模·数据挖掘·量子计算
wayz1119 小时前
Day 7:第一周复习与模型综合比较
人工智能·算法·机器学习·量化交易