使用高斯朴素贝叶斯算法对鸢尾花数据集进行分类

高斯朴素贝叶斯算法通常用于特征变量是连续变量,符合高素分布的情况。

使用高斯朴素贝叶斯算法对鸢尾花数据集进行分类

"""

使用高斯贝叶斯堆鸢尾花进行分类

"""

#导入需要的库

from sklearn.datasets import load_iris

from sklearn.model_selection import train_test_split

from sklearn.naive_bayes import GaussianNB

from sklearn.metrics import accuracy_score

#导入数据

x,y = load_iris().data,load_iris().target

#划分数据集

x_train,x_test,y_train,y_test = train_test_split(x,y,random_state=1, test_size=50)

#定义和训练模型

model = GaussianNB()

model.fit(x_train,y_train)

#模型评估

pred = model.predict(x_test)

print("测试集数据的预测标签为",pred)

print("测试集数据的真实标签为",y_test)

print("测试集共有%d条数据,其中预测错误的数据有%d条,预测准确率为%.2f"%(x_test.shape[0],(pred!=y_test).sum(),

accuracy_score(y_test,pred)))

输出的结果为:

测试集数据的预测标签为 [0 1 1 0 2 2 2 0 0 2 1 0 2 1 1 0 1 1 0 0 1 1 2 0 2 1 0 0 1 2 1 2 1 2 2 0 1

0 1 2 2 0 1 2 1 2 0 0 0 1]

测试集数据的真实标签为 [0 1 1 0 2 1 2 0 0 2 1 0 2 1 1 0 1 1 0 0 1 1 1 0 2 1 0 0 1 2 1 2 1 2 2 0 1

0 1 2 2 0 2 2 1 2 0 0 0 1]

测试集共有50条数据,其中预测错误的数据有3条,预测准确率为0.94

相关推荐
野犬寒鸦1 小时前
从零起步学习并发编程 || 第六章:ReentrantLock与synchronized 的辨析及运用
java·服务器·数据库·后端·学习·算法
霖霖总总1 小时前
[小技巧66]当自增主键耗尽:MySQL 主键溢出问题深度解析与雪花算法替代方案
mysql·算法
bruce_哈哈哈1 小时前
Claude Code--Feishu-Skill-demo
ai
rainbow68891 小时前
深入解析C++STL:map与set底层奥秘
java·数据结构·算法
wangjialelele2 小时前
平衡二叉搜索树:AVL树和红黑树
java·c语言·开发语言·数据结构·c++·算法·深度优先
User_芊芊君子2 小时前
HCCL高性能通信库编程指南:构建多卡并行训练系统
人工智能·游戏·ai·agent·测评
慢半拍iii2 小时前
对比源码解读:ops-nn中卷积算子的硬件加速实现原理
人工智能·深度学习·ai·cann
小白|2 小时前
CANN在自动驾驶感知中的应用:构建低延迟、高可靠多传感器融合推理系统
人工智能·机器学习·自动驾驶
驱动探索者2 小时前
linux mailbox 学习
linux·学习·算法
ringking1232 小时前
autoware-1:安装环境cuda/cudnn/tensorRT库函数的判断
人工智能·算法·机器学习