机器学习-K临近算法(1)

场景:相亲对象靠谱吗?

假设我们要判断一个男生是不是"优质男",我们根据两个指标来打分(1-10分):事业心家务能力

我们手里已经有 4 个已知身份的样本:

姓名 事业心 () 家务能力 () 结论(标签)
小王 8 2 事业型
小李 9 3 事业型
小张 2 8 居家型
小赵 3 7 居家型

现在来了一个新人:小明

小明的得分是:事业心 7分,家务能力 4分

我们要帮小明分个类,看看他离谁更近。我们设定 ****(找最近的 3 个人)。

第一步:算距离

我们要算小明和每个人的"直线距离"。公式就是:

  1. 跟小王的距离

  2. 跟小李的距离

  3. 跟小张的距离

  4. 跟小赵的距离

第二步:选邻居

我们把距离从小到大排个序:

  1. 小王 (2.24)
  2. 小李 (2.24)
  3. 小赵 (5.00)
  4. 小张 (6.40)

既然我们要找 **** 个最近的邻居,那前三名就是:小王、小李、小赵

第三步:投票
  • 小王 是"事业型"
  • 小李 是"事业型"
  • 小赵 是"居家型"

结果: 2 票对 1 票,事业型胜出!
结论: 算法认为小明属于 "事业型"


总结一下你刚才做的:

  1. 量身高:你算了新数据和老数据之间的"距离"。
  2. 找邻居:你挑了离得最近的几个点。
  3. 看人头:哪边人多,新来的就归哪边。
相关推荐
阿里云大数据AI技术12 小时前
光轮智能 × 阿里云:共建 Physical AI 云上数据、评测与持续学习基础设施
人工智能·机器学习
拾年2752 天前
大模型的"聪明"从哪来?聊聊 AI 数据集的那些事儿
人工智能·深度学习·机器学习
罗西的思考2 天前
机器人 / 强化学习】HIL-SERL:人类在环驱动的具身智能进化框架
人工智能·算法·机器学习
ShallWeL3 天前
【机器学习】(3)—— 线性回归:梯度下降
人工智能·机器学习
ShallWeL3 天前
【机器学习】(2)—— 线性回归:损失函数
人工智能·机器学习
Lihua奏6 天前
# 机器学习:机器是怎么从数据里学出规则的
机器学习