使用scikit-learn中的KNN包实现对鸢尾花数据集或者自定义数据集的的预测

代码:

复制代码
# 导入所需的库
from sklearn.datasets import load_iris  # 导入Iris数据集
from sklearn.model_selection import train_test_split  # 导入用于数据划分的train_test_split函数
from sklearn.preprocessing import MinMaxScaler, StandardScaler  # 导入数据归一化和标准化的类
from sklearn.neighbors import KNeighborsClassifier  # 导入K邻近分类器(KNN)

# 加载Iris数据集,包含特征数据和目标标签
iris = load_iris()

# 将数据集划分为训练集和测试集,其中20%作为测试集,80%作为训练集
x_train, x_test, y_train, y_test = train_test_split(iris['data'], iris['target'], test_size=0.2, random_state=42)

# 初始化MinMaxScaler,将特征缩放到[0, 1]的范围
transfer = MinMaxScaler(feature_range=(0, 1))

# 初始化StandardScaler,将特征进行标准化,均值为0,方差为1
transfer1 = StandardScaler()

# 对训练数据进行标准化
ret_train_data = transfer1.fit_transform(x_train)

# 对测试数据进行标准化
ret_test_data = transfer1.fit_transform(x_test)

# 设置KNN算法中的邻居数为5
n_neighbors_num = 5

# 初始化KNN分类器,设置邻居数
knn_model = KNeighborsClassifier(n_neighbors=n_neighbors_num)

# 用标准化后的训练数据训练KNN模型
knn_model.fit(ret_train_data, y_train)

# 用测试集数据进行预测
y_pre = knn_model.predict(ret_test_data)

# 输出预测结果
print("预测值是: \n", y_pre)

# 输出真实标签
print("真实值是 : \n", y_test)

# 对比预测值和真实值,输出是否一致的布尔值
print("预测值和真实值的对比是: \n", y_pre == y_test)

# 计算KNN模型在测试集上的准确率
score = knn_model.score(ret_test_data, y_test)

# 输出模型的准确率
print("准确率是: \n", score)

结果:

相关推荐
w_t_y_y40 分钟前
模型和算法篇(一)监督学习回归问题(2)树形回归
机器学习
AC赳赳老秦2 小时前
OpenClaw image-processing技能实操:批量抠图、图片尺寸调整,适配办公需求
开发语言·前端·人工智能·python·深度学习·机器学习·openclaw
Project_Observer2 小时前
为您的项目选择最合适的Zoho Projects自动化巧能
大数据·运维·人工智能·深度学习·机器学习·自动化·编辑器
好运的阿财3 小时前
“锟斤拷”问题——程序中用powershell执行命令出现中文乱码的解决办法
linux·前端·人工智能·机器学习·架构·编辑器·vim
沅_Yuan3 小时前
基于LSSVM-ABKDE的多输入单输出回归预测模型【MATLAB】
人工智能·神经网络·机器学习·matlab·回归预测·lssvm·kde
小陈工3 小时前
Python Web开发入门(十八):跨域问题解决方案——从“为什么我的请求被拦了“到“我让浏览器乖乖听话“
开发语言·python·机器学习·架构·数据挖掘·回归·状态模式
AI科技星3 小时前
全维度相对论推导、光速螺旋时空与北斗 GEO 钟差的统一理论
开发语言·线性代数·算法·机器学习·数学建模
Chef_Chen3 小时前
Agent学习--LLM--推理熵
人工智能·学习·机器学习
kishu_iOS&AI3 小时前
机器学习 —— 线性回归(实例)
人工智能·python·机器学习·线性回归
人工智能培训4 小时前
多模态AI模型融合难?核心问题与解决思路
人工智能·机器学习·prompt·agent·智能体