机器学习基础之《分类算法(2)—K-近邻算法》

一、K-近邻算法(KNN)

1、定义

KNN

K:就是一个自然数

N:nearest,最近的

N:neighbourhood,邻居

如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别

k = 1 容易受到异常点的影响

2、假设有一张北京地图,我不知道我在哪儿,目的是要知道我在北京的哪个区

这是一个分类问题

我不知道我在哪儿,但我知道我跟这几个人之间的距离,并且知道这5个人在哪个区

KNN核心思想:你的"邻居"来推断出你的类别

3、计算距离公式

两个样本的距离可以通过如下公式计算,又叫欧式距离

注意:二维空间则是d = sqrt((x2 - x1)^2 + (y2 - y1)^2)

其他距离公式:

曼哈顿距离---绝对值距离

闵可夫斯基距离

4、例子

相关推荐
爱喝可乐的老王1 小时前
机器学习监督学习模型--线性回归
人工智能·机器学习·线性回归
gorgeous(๑>؂<๑)1 小时前
【中国科学院光电研究所-张建林组-AAAI26】追踪不稳定目标:基于外观引导的运动建模在无人机拍摄视频中实现稳健的多目标跟踪
人工智能·机器学习·计算机视觉·目标跟踪·无人机
oscar9992 小时前
机器学习实战:多项式回归建模——从模拟数据到模型评估
人工智能·机器学习·回归
汽车仪器仪表相关领域2 小时前
双组分精准快检,汽修年检利器:MEXA-324M汽车尾气测量仪项目实战全解
大数据·人工智能·功能测试·测试工具·算法·机器学习·压力测试
LDG_AGI3 小时前
【机器学习】深度学习推荐系统(三十):X 推荐算法Phoenix rerank机制
人工智能·分布式·深度学习·算法·机器学习·推荐算法
python机器学习ML3 小时前
机器学习——16种模型(基础+集成学习)+多角度SHAP高级可视化+Streamlit交互式应用+RFE特征选择+Optuna+完整项目
人工智能·python·机器学习·分类·数据挖掘·scikit-learn·集成学习
木头程序员4 小时前
工业视觉的“零缺陷”悖论:小样本异常检测的可行路径
人工智能·机器学习
星河天欲瞩4 小时前
【深度学习Day1】环境配置(CUDA、PyTorch)
人工智能·pytorch·python·深度学习·学习·机器学习·conda
高洁014 小时前
知识图谱如何结合 RAG实现更精确的知识问答
人工智能·算法·机器学习·数据挖掘·知识图谱
爱喝可乐的老王5 小时前
机器学习监督学习模型----KNN
人工智能·算法·机器学习