基于决策树实现葡萄酒分类

基于决策树实现葡萄酒分类

将葡萄酒数据集拆分成训练集和测试集,搭建tree_1和tree_2两个决策树模型,tree_1使用信息增益作为特征选择指标,B树使用基尼指数作为特征选择指标,各自对训练集进行训练,然后分别对训练集和测试集进行预测。输出以下结果:

(1)tree_1(信息增益)在训练集上的准确率,在测试集上的准确率。

(2)tree_2(基尼指数)在训练集上的准确率,在测试集上的准确率。

源码

python 复制代码
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier

if __name__ == "__main__":
    print("2 基于决策树实现葡萄酒分类")
    print("李思强 20201107148")
    wine = load_wine()
    x_train,x_test,y_train,y_test = train_test_split(wine.data,wine.target)
    print("tree_1(信息增益)")
    tree_1 = DecisionTreeClassifier(criterion="entropy")
    tree_1.fit(x_train,y_train)
    train_score = tree_1.score(x_train,y_train)
    test_score = tree_1.score(x_test,y_test)

    print("训练集")
    print("准确率:", train_score)
    print("测试集")
    print("准确率:", test_score)
    print("tree_2(基尼指数)")
    tree_2 = DecisionTreeClassifier(criterion="gini")
    tree_2.fit(x_train,y_train)
    train_score = tree_2.score(x_train,y_train)
    test_score = tree_2.score(x_test,y_test)

    print("训练集:")
    print("准确率:", train_score)
    print("测试集")
    print("准确率:", test_score)

运行结果

相关推荐
珠海西格电力1 小时前
零碳园区的能源供给成本主要包括哪些方面?
大数据·分布式·微服务·架构·能源
经济元宇宙2 小时前
摄影培训行业百科:机构选择与学习路径全解析
大数据·人工智能·学习
GJGCY2 小时前
企业AI Agent落地架构深度解析:LLM+RAG+RPA+工具调用全流程
大数据·人工智能·ai·数字化·智能体
互联网科技看点3 小时前
数智化人事管理软件系统行业分析与推荐
大数据
2601_957780844 小时前
GPT API工程化接入:从演示验证到生产部署的完整实践
大数据·人工智能·gpt·架构
WL_Aurora4 小时前
YARN资源调度器深度解析 | 架构原理、作业提交流程
大数据·hadoop·yarn
团象科技4 小时前
2026出海技术观察:云API接口迭代的能力边界与业务增量空间
大数据·人工智能
元拓数智5 小时前
AI 自动化工作流,正在重塑企业数据工程的效率边界
大数据·人工智能·ai·自动化·工作流·数据工程
xwz小王子5 小时前
机器人学习十年进化史——从强化学习到VLA的范式变迁
大数据·学习·机器人
老詹图解IT5 小时前
银河麒麟V10(Kylin V10 SP1/SP3)常见报错对照表—2026年5月版
大数据·kylin