机器学习-K临近算法(1)

场景:相亲对象靠谱吗?

假设我们要判断一个男生是不是"优质男",我们根据两个指标来打分(1-10分):事业心家务能力

我们手里已经有 4 个已知身份的样本:

姓名 事业心 () 家务能力 () 结论(标签)
小王 8 2 事业型
小李 9 3 事业型
小张 2 8 居家型
小赵 3 7 居家型

现在来了一个新人:小明

小明的得分是:事业心 7分,家务能力 4分

我们要帮小明分个类,看看他离谁更近。我们设定 ****(找最近的 3 个人)。

第一步:算距离

我们要算小明和每个人的"直线距离"。公式就是:

  1. 跟小王的距离

  2. 跟小李的距离

  3. 跟小张的距离

  4. 跟小赵的距离

第二步:选邻居

我们把距离从小到大排个序:

  1. 小王 (2.24)
  2. 小李 (2.24)
  3. 小赵 (5.00)
  4. 小张 (6.40)

既然我们要找 **** 个最近的邻居,那前三名就是:小王、小李、小赵

第三步:投票
  • 小王 是"事业型"
  • 小李 是"事业型"
  • 小赵 是"居家型"

结果: 2 票对 1 票,事业型胜出!
结论: 算法认为小明属于 "事业型"


总结一下你刚才做的:

  1. 量身高:你算了新数据和老数据之间的"距离"。
  2. 找邻居:你挑了离得最近的几个点。
  3. 看人头:哪边人多,新来的就归哪边。
相关推荐
songyuc4 小时前
【Qwen】DataArguments说明
深度学习·算法·机器学习
2401_841495645 小时前
【机器学习】电商销售额预测实战
人工智能·python·机器学习·数据清洗·矩阵分解·特征可视化·模型训练评估
辰尘_星启6 小时前
[最优控制]MPC模型预测控制
线性代数·机器学习·机器人·概率论·控制·现代控制
亚里随笔6 小时前
相对优势估计存在偏差——揭示群体相对强化学习中的系统性偏差问题
人工智能·深度学习·机器学习·llm·agentic·rlvr
2501_948120158 小时前
基于机器学习的网络异常检测与响应技术研究
网络·机器学习·php
机器学习之心8 小时前
Stacking集成传统机器学习模型与新型KAN网络回归预测+五模型回归对比
人工智能·机器学习·回归·stacking集成·kan网络回归预测
szcsun59 小时前
机器学习(三)--分类问题
人工智能·机器学习·分类
汽车仪器仪表相关领域10 小时前
一表双显+±1%精度:MTX-D数字油压温度计赛车/改装车发动机监测实战全解
大数据·网络·数据库·人工智能·机器学习·单元测试·可用性测试
玄同76510 小时前
SQLAlchemy 模型定义完全指南:从基础到进阶的 ORM 实战
人工智能·python·sql·mysql·机器学习·自然语言处理·database