【机器学习 复习】第3章 K-近邻算法

一、概念

1.K-近邻算法:也叫KNN 分类 算法,其中的N是 邻近邻居NearestNeighbor的首字母。

(1)其中K是特征值,就是选择离某个预测的值(例如预测的是苹果,就找个苹果)最近的几个值,邻近的意思也很简单,就是距离上最近,距离测算主要分两种。

实际情况就是点的x,y这些值就是这个点的特征,一样的事物最后在坐标轴上位置离得很近,而你把预测值放进去,它离哪个近,可不就是哪个玩意嘛。

如果有几个类挨得特别近,就根据少数服从多数的投票法则,洒洒水啦~

(2)欧氏距离和曼哈顿距离:

2.K值大小的影响:

(1)K过小:造成过拟合,因为样本过少,所以看山是山。

(2)K过大:造成欠拟合,因为样本过多,假设判断的是人种,那么多都是人,那猿猴也有人的特征,很容易就也被归类到人里面了。

3.离差标准化(了解即可):

当x,z都是两位数的时候,加入y是五位数,那此时y对距离的影响达到了非常大,所以要对其进行标准化,有三种:

4.简单说一下代码:

二、习题

单选题:

2、关于k-近邻算法说法错误的是( D)

A k-近邻算法是机器学习

B k-近邻算法是监督学习

C k代表最近的K个样本

D k的选择对分类结果没有影响

3、关于k-近邻算法说法错误的是( B)

A k-近邻算法可以用来解决回归问题

B 随着k值的增大,决策边界会越来越复杂

C 一般使用投票法进行分类任务

D 距离计算方法不同,效果也可能有显著差别

多选题:

  1. K-近邻算法的基本要素包括(ABD )。

A、距离度量 B、K值选择 C、样本大小 D、分类决策规则

判断题:

  1. 最近邻算法中,样本的预测结果只由训练集中与其距离最近的那个样本决定。( )

PS:老师的答案是对,但是我搜的是错的。。。。

相关推荐
赵钰老师22 分钟前
【Deepseek、ChatGPT】智能气候前沿:AI Agent结合机器学习与深度学习在全球气候变化驱动因素预测中的应用
人工智能·python·深度学习·机器学习·数据分析
AIGC-Lison22 分钟前
【CSDN首发】Stable Diffusion从零到精通学习路线分享
人工智能·ai·stable diffusion·aigc·sd
AI绘画咪酱23 分钟前
Stable Diffusion|Ai赋能电商 Inpaint Anything
人工智能·ai·ai作画·stable diffusion·sd·ai教程·sd教程
ruokkk24 分钟前
Spring AI MCP 客户端实战:轻松连接高德地图等工具
人工智能
_一条咸鱼_25 分钟前
AI Agent 工作原理深入剖析
人工智能
飞哥数智坊26 分钟前
AI编程实战:数据大屏生成初探
人工智能
蚝油菜花28 分钟前
Cua:Mac用户狂喜!这个开源框架让AI直接接管你的电脑,快速实现AI自动化办公
人工智能·开源
蚝油菜花28 分钟前
AutoAgent:无需编程!接入DeepSeek用自然语言创建和部署AI智能体!港大开源框架让AI智能体开发变成填空题
人工智能·开源
nuise_30 分钟前
李宏毅机器学习笔记06 | 鱼和熊掌可以兼得的机器学习 - 内容接宝可梦
人工智能·笔记·机器学习
声网43 分钟前
MiniMax 发布新 TTS 模型 Speech-02,轻松制作长篇有声内容;Meta 高端眼镜年底推出:售价上千美元丨日报
人工智能