【sklearn练习】鸢尾花

一、

import numpy as np

from sklearn import datasets

from sklearn.model_selection import train_test_split

from sklearn.neighbors import KNeighborsClassifier

第二行:导入datasets数据集

第三行:train_test_split 的作用是将数据集随机分配训练集和测试集

第四行:采用的模型是,KNeighborsClassifier,实现 k 最近邻投票的分类器

二、

iris = datasets.load_iris()

iris_X = iris.data

iris_y = iris.target

第一行,获取鸢尾花数据集

第二行,将data存入iris_X

第三行,将标签存入iris_y

三、

print(iris_X[:2, :])

print(iris_y)

第一行,打印数据的前两行

第二行,打印标签

输出结果为:

\[5.1 3.5 1.4 0.2

4.9 3. 1.4 0.2\]

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2

四、

X_train, X_test, y_train, y_test = train_test_split(

iris_X, iris_y, test_size=0.3)

print(y_train)

第一行,函数 train_test_split将数据集乱序分为训练集和测试集。

第三行,打印y_train查看

输出结果为:

1 1 2 0 0 2 2 0 0 0 1 0 2 0 2 1 0 1 0 2 2 2 0 1 0 2 2 2 1 0 0 1 0 0 0 0 2 2 1 0 1 0 0 1 2 2 2 2 2 2 1 2 1 1 1 2 1 1 2 0 2 1 0 2 2 0 1 1 1 2 2 1 1 0 1 0 1 1 2 2 2 2 1 1 0 0 0 2 1 0 0 1 1 2 0 0 0 2 2 0 2 1 0 0 2

五、

knn = KNeighborsClassifier()

knn.fit(X_train, y_train)

第一行,类实例化

第二行,完成模型训练

六、

print(knn.predict(X_test))

print(y_test)

对比模型预测的标签和原标签

输出结果为:

1 2 0 0 0 2 2 0 2 1 1 0 1 2 1 1 0 1 0 1 1 0 0 0 2 1 0 0 1 1 2 2 2 0 2 1 2 1 2 2 2 1 0 2 1

1 2 0 0 0 2 2 0 2 1 1 0 1 2 1 1 0 1 0 1 1 0 0 0 2 1 0 0 1 1 2 2 2 0 1 1 2 1 2 1 2 1 0 2 1

相关推荐
测试19983 小时前
Web自动化测试:测试用例流程设计
自动化测试·软件测试·python·selenium·测试工具·职场和发展·测试用例
山烛7 小时前
矿物分类系统开发笔记(一):数据预处理
人工智能·python·机器学习·矿物分类
拾零吖7 小时前
吴恩达 Machine Learning(Class 3)
人工智能·机器学习
admiraldeworm7 小时前
Spring Boot + Spring AI 最小可运行 Demo
java·人工智能·ai
算法_小学生8 小时前
长短期记忆网络(LSTM)
人工智能·rnn·lstm
Virgil1398 小时前
【TrOCR】模型预训练权重各个文件解读
人工智能·pytorch·计算机视觉·自然语言处理·ocr·transformer
MaxCode-18 小时前
【机器学习 / 深度学习】基础教程
人工智能·深度学习·机器学习
先做个垃圾出来………8 小时前
神经网络(Neural Network, NN)
人工智能·深度学习·神经网络
我希望的一路生花8 小时前
Nik Collection 6.2全新版Nik降噪锐化调色PS/LR插件
人工智能·计算机视觉·设计模式·stable diffusion·aigc