基于决策树实现葡萄酒分类

基于决策树实现葡萄酒分类

将葡萄酒数据集拆分成训练集和测试集,搭建tree_1和tree_2两个决策树模型,tree_1使用信息增益作为特征选择指标,B树使用基尼指数作为特征选择指标,各自对训练集进行训练,然后分别对训练集和测试集进行预测。输出以下结果:

(1)tree_1(信息增益)在训练集上的准确率,在测试集上的准确率。

(2)tree_2(基尼指数)在训练集上的准确率,在测试集上的准确率。

源码

python 复制代码
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier

if __name__ == "__main__":
    print("2 基于决策树实现葡萄酒分类")
    print("李思强 20201107148")
    wine = load_wine()
    x_train,x_test,y_train,y_test = train_test_split(wine.data,wine.target)
    print("tree_1(信息增益)")
    tree_1 = DecisionTreeClassifier(criterion="entropy")
    tree_1.fit(x_train,y_train)
    train_score = tree_1.score(x_train,y_train)
    test_score = tree_1.score(x_test,y_test)

    print("训练集")
    print("准确率:", train_score)
    print("测试集")
    print("准确率:", test_score)
    print("tree_2(基尼指数)")
    tree_2 = DecisionTreeClassifier(criterion="gini")
    tree_2.fit(x_train,y_train)
    train_score = tree_2.score(x_train,y_train)
    test_score = tree_2.score(x_test,y_test)

    print("训练集:")
    print("准确率:", train_score)
    print("测试集")
    print("准确率:", test_score)

运行结果

相关推荐
TDengine (老段)38 分钟前
TDengine 支持的平台汇总
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
火龙谷40 分钟前
【hadoop】相关集群开启命令
大数据·hadoop·分布式
苏苏susuus41 分钟前
机器学习:集成学习概念和分类、随机森林、Adaboost、GBDT
机器学习·分类·集成学习
livemetee3 小时前
一个完整的日志收集方案:Elasticsearch + Logstash + Kibana+Filebeat (二)
大数据·elk·搜索引擎
TDengine (老段)3 小时前
TDengine 开发指南——无模式写入
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
TDengine (老段)3 小时前
TDengine 在电力行业如何使用 AI ?
大数据·数据库·人工智能·时序数据库·tdengine·涛思数据
盛寒5 小时前
自然语言处理 目录篇
大数据·自然语言处理
武子康5 小时前
大数据-276 Spark MLib - 基础介绍 机器学习算法 Bagging和Boosting区别 GBDT梯度提升树
大数据·人工智能·算法·机器学习·语言模型·spark-ml·boosting
武子康5 小时前
大数据-277 Spark MLib - 基础介绍 机器学习算法 Gradient Boosting GBDT算法原理 高效实现
大数据·人工智能·算法·机器学习·ai·spark-ml·boosting
咸鱼求放生13 小时前
es在Linux安装
大数据·elasticsearch·搜索引擎