KNN课堂(分类课堂(可用kd树/特征归一化提高精度)))

实验代码:

导入所需要的库

import numpy as np

import pandas as pd

from sklearn.ensemble import RandomForestClassifier

from sklearn.model_selection import train_test_split

from sklearn.neighbors import KNeighborsClassifier

导入数据集

df = pd.read_csv('C:\\Users\\Administrator\\Desktop\\iris.csv')

提取特征和标签

X = df.iloc[:, 0:4].values

y = df.iloc[:, 4].values

将数据集分为训练集和测试集

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

建立 KNN 模型

"""

  1. n_neighbors:整数值,表示要考虑的最近邻的数量。

  2. weights:可以是'uniform'或者是'distance',表示在计算最近邻的距离时考虑的权重,'uniform'表示所有最近邻的距离权重都一样,而'distance'表示距离越近的最近邻权重越大。

  3. algorithm:可以是'ball_tree'、'kd_tree'或者'brute',表示使用何种算法来计算最近邻的距离。

  4. leaf_size:整数值,表示在构建 ball_tree 或者 kd_tree 时考虑的叶节点的尺寸。

  5. metric:字符串值,表示使用何种度量来计算最近邻的距离,常用的有'euclidean'(欧几里得距离)和'minkowski'(闵可夫斯基距离)。

"""

knn = KNeighborsClassifier(n_neighbors=5)

knn.fit(X, y)

训练模型

knn.fit(X_train, y_train)

预测测试集结果

y_pred = knn.predict(X_test)

计算准确率

accuracy = knn.score(X_test, y_test)

打印准确率

print("Accuracy: {}".format(accuracy))

实验结果:

数据集:

见所提供资料

相关推荐
Elastic 中国社区官方博客10 分钟前
将嵌入映射到 Elasticsearch 字段类型:semantic_text、dense_vector、sparse_vector
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
FL162386312912 分钟前
咖啡叶子病害检测数据集VOC+YOLO格式1468张4类别均为单叶子
深度学习·yolo·机器学习
blues_C12 分钟前
二、【环境搭建篇】:Django 和 Vue3 开发环境准备
后端·python·django·vue3·测试平台
ywyy679824 分钟前
微小店推客系统开发:构建全民营销矩阵,解锁流量增长密码
人工智能·搜索引擎·微信小程序·系统·短剧·推客系统·微小店
郜太素24 分钟前
深度学习中的正则化方法与卷积神经网络基础
人工智能·pytorch·python·深度学习·神经网络·机器学习·cnn
Him__28 分钟前
AI能源危机:人工智能发展与环境可持续性的矛盾与解决之道
人工智能·ai·chatgpt·aigc·llama
pen-ai29 分钟前
【NLP】34. 数据专题:如何打造高质量训练数据集
人工智能·自然语言处理
蹦蹦跳跳真可爱58934 分钟前
Python----目标检测(labelimg和labelme的安装与使用,Pycharm配置教程)
人工智能·python·目标检测·计算机视觉·pycharm
英码科技36 分钟前
AI筑基,新质跃升|英码科技亮相华为广东新质生产力创新峰会,发布大模型一体机新品,助力产业智能化转型
人工智能·科技·华为
Vodka~37 分钟前
服务器多用户共享Conda环境操作指南——Ubuntu24.02
服务器·python·conda