【sklearn练习】鸢尾花

一、

import numpy as np

from sklearn import datasets

from sklearn.model_selection import train_test_split

from sklearn.neighbors import KNeighborsClassifier

第二行:导入datasets数据集

第三行:train_test_split 的作用是将数据集随机分配训练集和测试集

第四行:采用的模型是,KNeighborsClassifier,实现 k 最近邻投票的分类器

二、

iris = datasets.load_iris()

iris_X = iris.data

iris_y = iris.target

第一行,获取鸢尾花数据集

第二行,将data存入iris_X

第三行,将标签存入iris_y

三、

print(iris_X[:2, :])

print(iris_y)

第一行,打印数据的前两行

第二行,打印标签

输出结果为:

\[5.1 3.5 1.4 0.2

4.9 3. 1.4 0.2\]

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2

四、

X_train, X_test, y_train, y_test = train_test_split(

iris_X, iris_y, test_size=0.3)

print(y_train)

第一行,函数 train_test_split将数据集乱序分为训练集和测试集。

第三行,打印y_train查看

输出结果为:

1 1 2 0 0 2 2 0 0 0 1 0 2 0 2 1 0 1 0 2 2 2 0 1 0 2 2 2 1 0 0 1 0 0 0 0 2 2 1 0 1 0 0 1 2 2 2 2 2 2 1 2 1 1 1 2 1 1 2 0 2 1 0 2 2 0 1 1 1 2 2 1 1 0 1 0 1 1 2 2 2 2 1 1 0 0 0 2 1 0 0 1 1 2 0 0 0 2 2 0 2 1 0 0 2

五、

knn = KNeighborsClassifier()

knn.fit(X_train, y_train)

第一行,类实例化

第二行,完成模型训练

六、

print(knn.predict(X_test))

print(y_test)

对比模型预测的标签和原标签

输出结果为:

1 2 0 0 0 2 2 0 2 1 1 0 1 2 1 1 0 1 0 1 1 0 0 0 2 1 0 0 1 1 2 2 2 0 2 1 2 1 2 2 2 1 0 2 1

1 2 0 0 0 2 2 0 2 1 1 0 1 2 1 1 0 1 0 1 1 0 0 0 2 1 0 0 1 1 2 2 2 0 1 1 2 1 2 1 2 1 0 2 1

相关推荐
:mnong3 分钟前
附图报价系统设计分析6
人工智能·opengl·cad·python3.11·opencascade
倔强的胖蚂蚁7 分钟前
Transformer 大模型原理 完整入门指南
人工智能·深度学习·云原生·transformer
大强同学18 分钟前
Warp终端安装与设置
人工智能
码途漫谈29 分钟前
Easy-Vibe高级开发篇阅读笔记(二十一)——AI能力强化之RAG 与企业级智能客服
人工智能·笔记·ai·开源·ai编程
薛定猫AI30 分钟前
【深度解析】Hermes Agent:持久记忆、自学习闭环与桌面化 Autonomous AI 工作流实践
人工智能·学习
Resistance丶未来35 分钟前
Sub2API:订阅转API网关平台,魔芋AI接入指南
人工智能·gpt·大模型·claude·gemini·skill·sub2api
构建的乐趣40 分钟前
测度(Measure)和概率测度(Probability Measure) 测度和度量的区别
python
独隅43 分钟前
用 Anaconda 驯服 AI 开发流:从数据预处理到模型部署的全链路环境标准化实战指南
人工智能·neo4j
清水白石0081 小时前
把事故变成护城河:如何设计回归测试,防止“订单重复创建”这类历史 Bug 卷土重来?
python·bug