基于决策树实现葡萄酒分类

基于决策树实现葡萄酒分类

将葡萄酒数据集拆分成训练集和测试集,搭建tree_1和tree_2两个决策树模型,tree_1使用信息增益作为特征选择指标,B树使用基尼指数作为特征选择指标,各自对训练集进行训练,然后分别对训练集和测试集进行预测。输出以下结果:

(1)tree_1(信息增益)在训练集上的准确率,在测试集上的准确率。

(2)tree_2(基尼指数)在训练集上的准确率,在测试集上的准确率。

源码

python 复制代码
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier

if __name__ == "__main__":
    print("2 基于决策树实现葡萄酒分类")
    print("李思强 20201107148")
    wine = load_wine()
    x_train,x_test,y_train,y_test = train_test_split(wine.data,wine.target)
    print("tree_1(信息增益)")
    tree_1 = DecisionTreeClassifier(criterion="entropy")
    tree_1.fit(x_train,y_train)
    train_score = tree_1.score(x_train,y_train)
    test_score = tree_1.score(x_test,y_test)

    print("训练集")
    print("准确率:", train_score)
    print("测试集")
    print("准确率:", test_score)
    print("tree_2(基尼指数)")
    tree_2 = DecisionTreeClassifier(criterion="gini")
    tree_2.fit(x_train,y_train)
    train_score = tree_2.score(x_train,y_train)
    test_score = tree_2.score(x_test,y_test)

    print("训练集:")
    print("准确率:", train_score)
    print("测试集")
    print("准确率:", test_score)

运行结果

相关推荐
村雨遥1 小时前
Flink 状态管理的核心能力
大数据·flink
qq_508823407 小时前
金融量化指标--2Alpha 阿尔法
大数据·人工智能
好家伙VCC8 小时前
数学建模模型 全网最全 数学建模常见算法汇总 含代码分析讲解
大数据·嵌入式硬件·算法·数学建模
2301_7816686111 小时前
Elasticsearch 02
大数据·elasticsearch·搜索引擎
isfox12 小时前
Google GFS 深度解析:分布式文件系统的开山之作
大数据·hadoop
用户Taobaoapi201412 小时前
京东店铺所有商品API技术开发文档
大数据·数据挖掘·数据分析
在未来等你12 小时前
Kafka面试精讲 Day 8:日志清理与数据保留策略
大数据·分布式·面试·kafka·消息队列
江畔独步13 小时前
Flink TaskManager日志时间与实际时间有偏差
大数据·flink
一只懒洋洋13 小时前
K-meas 聚类、KNN算法、决策树、随机森林
算法·决策树·聚类
TDengine (老段)14 小时前
TDengine 选择函数 Last() 用户手册
大数据·数据库·sql·物联网·时序数据库·tdengine·涛思数据