机器学习day2

一、KNN算法简介

KNN 算法,或者称 k最邻近算法,是 有监督学习中的分类算法 。它可以用于分类或回归问题,但它通常用作分类算法。

二、KNN分类流程

1.计算未知样本到每一个训练样本的距离

2.将训练样本根据距离大小升序排列

3.取出距离最近的 K 个训练样本

4.进行多数表决,统计 K 个样本中哪个类别的样本个数最多

5.将未知的样本归属到出现次数最多的类别

三、KNN回归流程

1.计算未知样本到每一个训练样本的距离

2.将训练样本根据距离大小升序排列

3.取出距离最近的 K 个训练样本

4.把这个 K 个样本的目标值计算其平均值

5.作为将未知的样本预测的值

四、KNN算法中K的选择

K值过小,过拟合(模型更易受到异常点影响)

K值过大,欠拟合

五、KNN算法API使用

1.分类问题

scikit-learn中,可以使用KNeighborsClassifier类来实现KNN分类。以下是一个简单的示例:

python 复制代码
# 导包
from sklearn.neighbors import KNeighborsClassifier

# 导数据
x = [[0, 1, 3], [1, 3, 2], [2, 4, 5], [3, 6, 4]]
y = [0, 0, 1, 1]

# 实例化对象
model = KNeighborsClassifier(n_neighbors=3) #参数n_neighbors指定了在预测时使用的邻居数量

# 训练(-->评估)
model.fit(x, y) #fit计算每个数据点之间的距离

# 预测
myret = model.predict([[4, 3, 7]])

print(f'预测值:{myret}')

2.回归问题

对于回归问题,scikit-learn提供了KNeighborsRegressor类。以下是一个简单的示例:

python 复制代码
# 导包
from sklearn.neighbors import KNeighborsRegressor
# 导数据
x = [[1, 2, 3], [2, 4, 5], [2, 3, 6], [4, 5, 1]]
y = [0.1, 0.2, 0.3, 0.4]
# 实例化对象
model = KNeighborsRegressor(n_neighbors=3)
# 训练
model.fit(x, y)
# 评估
mypre = model.predict([[2, 6, 3]])
print(f"预测值:{mypre}")
相关推荐
晨曦中的暮雨4 分钟前
动态规划专题Day1——打家劫舍系列
算法·动态规划
khalil10205 分钟前
代码随想录算法训练营Day-52 图论03 | 101.孤岛的总面积、102.沉没孤岛、103.水流问题、104.建造最大岛屿
c++·算法·图论
老四啊laosi6 分钟前
[滑动窗口] 13. 水果成篮
算法·leetcode·滑动窗口·水果成篮
刀法如飞9 分钟前
Palantir技术原理深度分析:Ontology 存储结构与读写方式
人工智能·算法·架构
澈20713 分钟前
图论基础:邻接矩阵与邻接表详解
算法·图论·邻接矩阵
白日做梦Q18 分钟前
Miniconda 新手保姆级教程:从安装到熟练使用(全程无跳步,避坑指南附全)
人工智能·深度学习·算法·机器学习
吃好睡好便好19 分钟前
在Matlab中绘制变半径柱面图
开发语言·人工智能·学习·算法·matlab
拂拉氏22 分钟前
【知识讲解-题目讲解】:二叉树的前、中、后序遍历的三种实现(递归,非递归,Morris遍历)与二叉树oj题讲解(二叉树最近公共祖先,二叉树展开为链表)
数据结构·算法·leetcode·二叉树·遍历
luck_bor23 分钟前
File 类核心笔记
java·前端·算法
anew___36 分钟前
从高方差到稳定训练:深度强化学习算法演进全解析
算法