机器学习-K临近算法(1)

场景:相亲对象靠谱吗?

假设我们要判断一个男生是不是"优质男",我们根据两个指标来打分(1-10分):事业心家务能力

我们手里已经有 4 个已知身份的样本:

姓名 事业心 () 家务能力 () 结论(标签)
小王 8 2 事业型
小李 9 3 事业型
小张 2 8 居家型
小赵 3 7 居家型

现在来了一个新人:小明

小明的得分是:事业心 7分,家务能力 4分

我们要帮小明分个类,看看他离谁更近。我们设定 ****(找最近的 3 个人)。

第一步:算距离

我们要算小明和每个人的"直线距离"。公式就是:

  1. 跟小王的距离

  2. 跟小李的距离

  3. 跟小张的距离

  4. 跟小赵的距离

第二步:选邻居

我们把距离从小到大排个序:

  1. 小王 (2.24)
  2. 小李 (2.24)
  3. 小赵 (5.00)
  4. 小张 (6.40)

既然我们要找 **** 个最近的邻居,那前三名就是:小王、小李、小赵

第三步:投票
  • 小王 是"事业型"
  • 小李 是"事业型"
  • 小赵 是"居家型"

结果: 2 票对 1 票,事业型胜出!
结论: 算法认为小明属于 "事业型"


总结一下你刚才做的:

  1. 量身高:你算了新数据和老数据之间的"距离"。
  2. 找邻居:你挑了离得最近的几个点。
  3. 看人头:哪边人多,新来的就归哪边。
相关推荐
小瑞瑞acd28 分钟前
【小瑞瑞精讲】卷积神经网络(CNN):从入门到精通,计算机如何“看”懂世界?
人工智能·python·深度学习·神经网络·机器学习
民乐团扒谱机1 小时前
【微实验】机器学习之集成学习 GBDT和XGBoost 附 matlab仿真代码 复制即可运行
人工智能·机器学习·matlab·集成学习·xgboost·gbdt·梯度提升树
Σίσυφος19001 小时前
PCL法向量估计 之 RANSAC 平面估计法向量
算法·机器学习·平面
rcc86282 小时前
AI应用核心技能:从入门到精通的实战指南
人工智能·机器学习
霖大侠2 小时前
【无标题】
人工智能·深度学习·机器学习
B站_计算机毕业设计之家2 小时前
猫眼电影数据可视化与智能分析平台 | Python Flask框架 Echarts 推荐算法 爬虫 大数据 毕业设计源码
python·机器学习·信息可视化·flask·毕业设计·echarts·推荐算法
deephub3 小时前
机器学习特征工程:分类变量的数值化处理方法
python·机器学习·特征工程·分类变量
墩墩冰3 小时前
计算机图形学 实现直线段的反走样
人工智能·机器学习
B站_计算机毕业设计之家3 小时前
豆瓣电影数据可视化分析系统 | Python Flask框架 requests Echarts 大数据 人工智能 毕业设计源码(建议收藏)✅
大数据·python·机器学习·数据挖掘·flask·毕业设计·echarts
weixin_395448914 小时前
cursor日志
人工智能·python·机器学习