机器学习-K临近算法(1)

场景:相亲对象靠谱吗?

假设我们要判断一个男生是不是"优质男",我们根据两个指标来打分(1-10分):事业心家务能力

我们手里已经有 4 个已知身份的样本:

姓名 事业心 () 家务能力 () 结论(标签)
小王 8 2 事业型
小李 9 3 事业型
小张 2 8 居家型
小赵 3 7 居家型

现在来了一个新人:小明

小明的得分是:事业心 7分,家务能力 4分

我们要帮小明分个类,看看他离谁更近。我们设定 ****(找最近的 3 个人)。

第一步:算距离

我们要算小明和每个人的"直线距离"。公式就是:

  1. 跟小王的距离

  2. 跟小李的距离

  3. 跟小张的距离

  4. 跟小赵的距离

第二步:选邻居

我们把距离从小到大排个序:

  1. 小王 (2.24)
  2. 小李 (2.24)
  3. 小赵 (5.00)
  4. 小张 (6.40)

既然我们要找 **** 个最近的邻居,那前三名就是:小王、小李、小赵

第三步:投票
  • 小王 是"事业型"
  • 小李 是"事业型"
  • 小赵 是"居家型"

结果: 2 票对 1 票,事业型胜出!
结论: 算法认为小明属于 "事业型"


总结一下你刚才做的:

  1. 量身高:你算了新数据和老数据之间的"距离"。
  2. 找邻居:你挑了离得最近的几个点。
  3. 看人头:哪边人多,新来的就归哪边。
相关推荐
PNP Robotics1 小时前
领军军者|PNP机器人包文涛:以具身智能定义机器人的“生命直觉”
人工智能·深度学习·学习·机器学习·机器人
lkforce4 小时前
MiniMind学习笔记(三)--train_pretrain.py(预训练)
笔记·机器学习·ai·预训练·minimind·train_pretrain
lwf0061645 小时前
DeepFM 学习日记
深度学习·机器学习
数据智能老司机5 小时前
学习 AutoML——理解 AutoML 流水线
机器学习
我是大聪明.7 小时前
大模型Tokenizer原理:深入理解BPE与WordPiece子词编码技术
人工智能·深度学习·机器学习
人工智能培训7 小时前
工程科研中的AI应用:结构力学分析技巧
人工智能·深度学习·机器学习·docker·容器
Mr数据杨7 小时前
飞船乘客状态预测与金融风控建模启发
大数据·机器学习·数据分析·kaggle
wayz117 小时前
Day 18:Keras深度学习框架入门
人工智能·深度学习·神经网络·算法·机器学习·keras
AI科技星7 小时前
《基于 1 的 N 维分形与对称统一理论》
人工智能·算法·机器学习·数学建模·数据挖掘
Mr数据杨9 小时前
花卉图像分类在植物识别与生态监测中的应用
人工智能·机器学习·分类·数据挖掘·数据分析·kaggle