sklearn学习(4)K近邻(KNN)

#K近邻是一种直观和简单的监督学习方法,既可以用在分类任务也可用在回归任务,其主要思想是对于一个新样本计算离它最近的k个样本一般为奇数个,看这k个在哪一类中的数量多,则属于那一类。需要注意的是在进行KNN之前最好对数据进行标准化处理,避免由于量纲导致不利影响。

导入库

复制代码
from sklearn.metrics import accuracy_score
from sklearn.neighbors import KNeighborsClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import classification_report

加载数据

复制代码
iris=load_iris()
x=iris.data
y=iris.target

标准化并划分数据集和测试集

复制代码
#标准化
sc=StandardScaler()
x=sc.fit_transform(x)
#划分训练集和测试集
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2)

创建KNN

复制代码
#创建KNN
knn=KNeighborsClassifier(n_neighbors=3)
#参数解释
#n_neighbors=3,表示根据K个点投票看新类别在哪个类别
#weights=uniform,表示每个邻居的权重相同 还有distance表示距离越近权重越大 默认是uniform
#algorithm=auto,表示计算方式,默认是auto,还有ball_tree kd_tree brute 表示使用的算法
#leaf_size=30,表示叶子节点的个数,默认是30 仅在algorithm=ball_tree和kd_tree时使用
#p=2,表示距离的度量方式,默认是欧氏距离,还有曼哈顿距离
#metric=euclidean,表示距离的度量方式,默认是欧氏距离,还有曼哈顿距离等
#训练
knn.fit(x_train,y_train)#注意这是惰性训练,只会存储数据,不会有模型

测试

复制代码
y_predict=knn.predict(x_test)
print(y_test)
print(y_predict)
print(y_predict==y_test)

计算准确率并输出报告

复制代码
#计算准确率
accuracy=accuracy_score(y_test,y_predict)
print("准确率:",accuracy)
accur=knn.score(x_test,y_test)
print("准确率:",accur)

#分类报告
print(classification_report(y_test,y_predict,target_names=iris.target_names))
相关推荐
xwz小王子4 小时前
Nature 正刊:可穿戴膝关节机器人,重量仅为0.96 kg!让脊髓性肌萎缩症患儿重获站立能力
人工智能·机器人
白露与泡影4 小时前
自己用 ai 写了个链接 mysql 数据库的 mcp 工具
数据库·人工智能·mysql
掘根4 小时前
【openCV】键盘响应,像素逻辑操作,通道分离合并,抠像
人工智能·opencv·计算机视觉
一条泥憨鱼4 小时前
让AI从“死记硬背”到“开卷考试”:详解RAG技术的奥秘
人工智能·ai·语言模型·机器人·rag
EntyIU4 小时前
Python学习笔记
笔记·python·学习
霍格沃兹测试学院-小舟畅学4 小时前
高质量测试 Skill 编写手册 -- 渐进式披露
人工智能
MediaTea4 小时前
DL:生成对抗网络的基本原理与 PyTorch 实现
人工智能·pytorch·深度学习·神经网络·生成对抗网络
魔法阵维护师4 小时前
从零开发游戏需要学习的c#模块,第二十四章(场景管理 —— 标题、游戏、结束画面)
学习·游戏·c#
韦胖漫谈IT4 小时前
数据与模型投毒 - 大语言模型 OWASP TOP 10系列
人工智能·语言模型·自然语言处理
wuxinyan1234 小时前
工业级大模型学习之路025:问题解决-检索质量全为0
人工智能·python·学习·langchain