KNN课堂(分类课堂(可用kd树/特征归一化提高精度)))

实验代码:

导入所需要的库

import numpy as np

import pandas as pd

from sklearn.ensemble import RandomForestClassifier

from sklearn.model_selection import train_test_split

from sklearn.neighbors import KNeighborsClassifier

导入数据集

df = pd.read_csv('C:\\Users\\Administrator\\Desktop\\iris.csv')

提取特征和标签

X = df.iloc[:, 0:4].values

y = df.iloc[:, 4].values

将数据集分为训练集和测试集

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

建立 KNN 模型

"""

  1. n_neighbors:整数值,表示要考虑的最近邻的数量。

  2. weights:可以是'uniform'或者是'distance',表示在计算最近邻的距离时考虑的权重,'uniform'表示所有最近邻的距离权重都一样,而'distance'表示距离越近的最近邻权重越大。

  3. algorithm:可以是'ball_tree'、'kd_tree'或者'brute',表示使用何种算法来计算最近邻的距离。

  4. leaf_size:整数值,表示在构建 ball_tree 或者 kd_tree 时考虑的叶节点的尺寸。

  5. metric:字符串值,表示使用何种度量来计算最近邻的距离,常用的有'euclidean'(欧几里得距离)和'minkowski'(闵可夫斯基距离)。

"""

knn = KNeighborsClassifier(n_neighbors=5)

knn.fit(X, y)

训练模型

knn.fit(X_train, y_train)

预测测试集结果

y_pred = knn.predict(X_test)

计算准确率

accuracy = knn.score(X_test, y_test)

打印准确率

print("Accuracy: {}".format(accuracy))

实验结果:

数据集:

见所提供资料

相关推荐
独行soc16 分钟前
2025年渗透测试面试题总结-66(题目+回答)
java·网络·python·安全·web安全·adb·渗透测试
先做个垃圾出来………1 小时前
残差连接的概念与作用
人工智能·算法·机器学习·语言模型·自然语言处理
AI小书房1 小时前
【人工智能通识专栏】第十三讲:图像处理
人工智能
fanstuck1 小时前
基于大模型的个性化推荐系统实现探索与应用
大数据·人工智能·语言模型·数据挖掘
多看书少吃饭3 小时前
基于 OpenCV 的眼球识别算法以及青光眼算法识别
人工智能·opencv·计算机视觉
Y学院3 小时前
Python 数据分析:从新手到高手的“摸鱼”指南
python·数据分析
IT学长编程3 小时前
计算机毕业设计 基于大数据技术的医疗数据分析与研究 Python 大数据毕业设计 Hadoop毕业设计选题【附源码+文档报告+安装调试】
大数据·hadoop·机器学习·数据分析·毕业设计·毕业论文·医疗数据分析
一条数据库3 小时前
南京方言数据集|300小时高质量自然对话音频|专业录音棚采集|方言语音识别模型训练|情感计算研究|方言保护文化遗产数字化|语音情感识别|方言对话系统开发
人工智能·音视频·语音识别
Yingjun Mo3 小时前
1. 统计推断-基于神经网络与Langevin扩散的自适应潜变量建模与优化
人工智能·神经网络·算法·机器学习·概率论