场景:相亲对象靠谱吗?
假设我们要判断一个男生是不是"优质男",我们根据两个指标来打分(1-10分):事业心 和家务能力。
我们手里已经有 4 个已知身份的样本:
| 姓名 | 事业心 () | 家务能力 () | 结论(标签) |
|---|---|---|---|
| 小王 | 8 | 2 | 事业型 |
| 小李 | 9 | 3 | 事业型 |
| 小张 | 2 | 8 | 居家型 |
| 小赵 | 3 | 7 | 居家型 |
现在来了一个新人:小明
小明的得分是:事业心 7分,家务能力 4分 。
我们要帮小明分个类,看看他离谁更近。我们设定 ****(找最近的 3 个人)。
第一步:算距离
我们要算小明和每个人的"直线距离"。公式就是:
-
跟小王的距离:
-
跟小李的距离:
-
跟小张的距离:
-
跟小赵的距离:
第二步:选邻居
我们把距离从小到大排个序:
- 小王 (2.24)
- 小李 (2.24)
- 小赵 (5.00)
- 小张 (6.40)
既然我们要找 **** 个最近的邻居,那前三名就是:小王、小李、小赵。
第三步:投票
- 小王 是"事业型"
- 小李 是"事业型"
- 小赵 是"居家型"
结果: 2 票对 1 票,事业型胜出!
结论: 算法认为小明属于 "事业型"。
总结一下你刚才做的:
- 量身高:你算了新数据和老数据之间的"距离"。
- 找邻居:你挑了离得最近的几个点。
- 看人头:哪边人多,新来的就归哪边。