基于决策树实现葡萄酒分类

基于决策树实现葡萄酒分类

将葡萄酒数据集拆分成训练集和测试集,搭建tree_1和tree_2两个决策树模型,tree_1使用信息增益作为特征选择指标,B树使用基尼指数作为特征选择指标,各自对训练集进行训练,然后分别对训练集和测试集进行预测。输出以下结果:

(1)tree_1(信息增益)在训练集上的准确率,在测试集上的准确率。

(2)tree_2(基尼指数)在训练集上的准确率,在测试集上的准确率。

源码

python 复制代码
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier

if __name__ == "__main__":
    print("2 基于决策树实现葡萄酒分类")
    print("李思强 20201107148")
    wine = load_wine()
    x_train,x_test,y_train,y_test = train_test_split(wine.data,wine.target)
    print("tree_1(信息增益)")
    tree_1 = DecisionTreeClassifier(criterion="entropy")
    tree_1.fit(x_train,y_train)
    train_score = tree_1.score(x_train,y_train)
    test_score = tree_1.score(x_test,y_test)

    print("训练集")
    print("准确率:", train_score)
    print("测试集")
    print("准确率:", test_score)
    print("tree_2(基尼指数)")
    tree_2 = DecisionTreeClassifier(criterion="gini")
    tree_2.fit(x_train,y_train)
    train_score = tree_2.score(x_train,y_train)
    test_score = tree_2.score(x_test,y_test)

    print("训练集:")
    print("准确率:", train_score)
    print("测试集")
    print("准确率:", test_score)

运行结果

相关推荐
JZC_xiaozhong38 分钟前
主数据同步失效引发的业务风险与集成架构治理
大数据·架构·数据一致性·mdm·主数据管理·数据孤岛解决方案·数据集成与应用集成
T06205141 小时前
【数据集】全国各地区教育139个相关指标数据集(2000-2024年)
大数据
故乡de云1 小时前
Vertex AI 企业账号体系,Google Cloud 才能完整支撑
大数据·人工智能
汽车仪器仪表相关领域1 小时前
AI赋能智能检测,引领灯光检测新高度——NHD-6109智能全自动远近光检测仪项目实战分享
大数据·人工智能·功能测试·机器学习·汽车·可用性测试·安全性测试
木头程序员1 小时前
大模型边缘部署突破:动态推理技术与精度-延迟-能耗帕累托优化
大数据·人工智能·计算机视觉·自然语言处理·智能手机·数据挖掘
DX_水位流量监测1 小时前
无人机测流之雷达流速仪监测技术分析
大数据·网络·人工智能·数据分析·自动化·无人机
鹿衔`1 小时前
Hadoop HDFS 核心机制与设计理念浅析文档
大数据·hadoop·hdfs
萤丰信息2 小时前
开启园区“生命体”时代——智慧园区系统,定义未来的办公与生活
java·大数据·运维·数据库·人工智能·生活·智慧园区
TDengine (老段)2 小时前
TDengine Rust 连接器进阶指南
大数据·数据库·物联网·rust·时序数据库·tdengine·涛思数据
YangYang9YangYan2 小时前
中专大数据技术专业学习数据分析的价值分析
大数据·学习·数据分析