【sklearn练习】鸢尾花

一、

python 复制代码
import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

第二行:导入datasets数据集

第三行:train_test_split 的作用是将数据集随机分配训练集和测试集。

第四行:采用的模型是,KNeighborsClassifier,实现 k 最近邻投票的分类器。

二、

python 复制代码
iris = datasets.load_iris()
iris_X = iris.data
iris_y = iris.target

第一行,获取鸢尾花数据集

第二行,将data存入iris_X

第三行,将标签存入iris_y

三、

python 复制代码
print(iris_X[:2, :])
print(iris_y)

第一行,打印数据的前两行

第二行,打印标签

输出结果为:

python 复制代码
[[5.1 3.5 1.4 0.2]
 [4.9 3.  1.4 0.2]]
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2]

四、

python 复制代码
X_train, X_test, y_train, y_test = train_test_split(
    iris_X, iris_y, test_size=0.3)
print(y_train)

第一行,函数 train_test_split将数据集乱序分为训练集和测试集。

第三行,打印y_train查看

输出结果为:

python 复制代码
[1 1 2 0 0 2 2 0 0 0 1 0 2 0 2 1 0 1 0 2 2 2 0 1 0 2 2 2 1 0 0 1 0 0 0 0 2
 2 1 0 1 0 0 1 2 2 2 2 2 2 1 2 1 1 1 2 1 1 2 0 2 1 0 2 2 0 1 1 1 2 2 1 1 0
 1 0 1 1 2 2 2 2 1 1 0 0 0 2 1 0 0 1 1 2 0 0 0 2 2 0 2 1 0 0 2]

五、

python 复制代码
knn = KNeighborsClassifier()
knn.fit(X_train, y_train)

第一行,类实例化

第二行,完成模型训练

六、

python 复制代码
print(knn.predict(X_test))
print(y_test)

对比模型预测的标签和原标签

输出结果为:

python 复制代码
[1 2 0 0 0 2 2 0 2 1 1 0 1 2 1 1 0 1 0 1 1 0 0 0 2 1 0 0 1 1 2 2 2 0 2 1 2
 1 2 2 2 1 0 2 1]
[1 2 0 0 0 2 2 0 2 1 1 0 1 2 1 1 0 1 0 1 1 0 0 0 2 1 0 0 1 1 2 2 2 0 1 1 2
 1 2 1 2 1 0 2 1]
相关推荐
AI数据皮皮侠2 分钟前
中国区域10m空间分辨率楼高数据集(全国/分省/分市/免费数据)
大数据·人工智能·机器学习·分类·业界资讯
静心问道10 分钟前
大语言模型能够理解并可以通过情绪刺激进行增强
人工智能·语言模型·大模型
站大爷IP11 分钟前
Python文件操作的"保险箱":with语句深度实战指南
python
运器12317 分钟前
【一起来学AI大模型】算法核心:数组/哈希表/树/排序/动态规划(LeetCode精练)
开发语言·人工智能·python·算法·ai·散列表·ai编程
aneasystone本尊20 分钟前
管理 Claude Code 的工具权限
人工智能
聚客AI35 分钟前
大模型学习进阶路线图:从Prompt到预训练的四阶段全景解析
人工智能·llm·掘金·日新计划
晓131340 分钟前
第七章 OpenCV篇——角点检测与特征检测
人工智能·深度学习·计算机视觉
DeepSeek大模型官方教程1 小时前
NLP之文本纠错开源大模型:兼看语音大模型总结
大数据·人工智能·ai·自然语言处理·大模型·产品经理·大模型学习
MidJourney中文版2 小时前
深度报告:中老年AI陪伴机器人需求分析
人工智能·机器人
王上上2 小时前
【论文阅读41】-LSTM-PINN预测人口
论文阅读·人工智能·lstm