sklearn中的决策树

sklearn 中的决策树

关键概念、核心问题

  • 节点

    1. 根节点:没有进边,有出边。包含最初的,针对特征的提问。
    2. 中间节点:既有进边也有出边,进边只有一条,出边可以有很多条。都是针对特征的提问。
    3. 叶子节点:有进边,没有出边,每个叶子节点都是一个类别标签。
    4. 子节点和父节点:在两个相连的节点中,更接近根节点的是父节点,另一个是子节点。
  • 核心问题

    1. 如何从数据表中找出最佳节点和最佳分枝?

    2. 如何让决策树停止生长,防止过拟合?

模块sklearn.tree

  • sklearn中决策树的类都在"tree"这个模块之下。这个模块总共包含五个类:

    tree.DecisionTreeClassifier 分类树
    tree.DecisionTreeRegressor 回归树
    tree.export_graphviz 将生成的决策树导出为DOT格式,画图专用
    tree.ExtraTreeClassifier 高随机版本的分类树
    tree.ExtraTreeRegressor 高随机版本的回归树

sklearn的基本建模流程

  • sklearn建模的基本流程

    在这个流程下,分类树对应的代码是:

    python 复制代码
    from sklearn import tree                #导入需要的模块
    
    clf = tree.DecisionTreeClassifier()     #实例化
    clf = clf.fit(X_train,y_train)          #用训练集数据训练模型
    result = clf.score(X_test,y_test)       #导入测试集,从接口中调用需要的信息

sklearn .metrics方法

  • 获取sklearn.metrics中的所有评估方法

    python 复制代码
    import sklearn
    
    sorted(sklearn.metrics.SCORERS.keys())
    
    """输出"""
    ['accuracy',
     'adjusted_mutual_info_score',
     'adjusted_rand_score',
     'average_precision',
     'completeness_score',
     'explained_variance',
     'f1',
     'f1_macro',
     'f1_micro',
     'f1_samples',
     'f1_weighted',
     'fowlkes_mallows_score',
     'homogeneity_score',
     'log_loss',
     'mean_absolute_error',
     'mean_squared_error',
     'median_absolute_error',
     'mutual_info_score',
     'neg_log_loss',
     'neg_mean_absolute_error',
     'neg_mean_squared_error',
     'neg_mean_squared_log_error',
     'neg_median_absolute_error',
     'normalized_mutual_info_score',
     'precision',
     'precision_macro',
     'precision_micro',
     'precision_samples',
     'precision_weighted',
     'r2',
     'recall',
     'recall_macro',
     'recall_micro',
     'recall_samples',
     'recall_weighted',
     'roc_auc',
     'v_measure_score']

相关推荐
热爱生活的五柒15 分钟前
深度学习大幅度提高准确率方法,本人亲测,调参方法,大幅度提升准确率方法(极其重要!!!多次看!0430)
人工智能·深度学习
FlagOS智算系统软件栈15 分钟前
众智 FlagOS Day0 实现 DeepSeek-V4 八芯适配:1.6T & 284B双模型,多元算力开箱即用
人工智能
Agent产品评测局17 分钟前
生产排期与MES/ERP系统打通,实操方法详解 —— 2026企业级智能体自动化选型与实战指南
java·运维·人工智能·ai·chatgpt·自动化
kft131418 分钟前
AI 驱动测试 2.0:当测试智能体成为你的“超级 QA“
大数据·人工智能·elasticsearch
启效云25 分钟前
启效云战略升级:本体论落地 AI 原生应用智能体,打造中国版 Palantir 数字基座
人工智能·低代码·软件开发·低代码开发·零码化编辑器
jarvisuni25 分钟前
GLM5.1 降智了?国模思考强度研究!
人工智能·ai编程
IT_陈寒39 分钟前
SpringBoot自动配置的坑差点让我加班到天亮
前端·人工智能·后端
亿信华辰软件43 分钟前
睿治Agent数据治理平台重磅发布:数据治理大脑+全栈Agent,以AI重构数据治理全流程
大数据·人工智能
源码老李44 分钟前
独立游戏AI音乐指南:用Suno AI让游戏拥有灵魂
人工智能·游戏·ai编程
:mnong1 小时前
AI 编程理论与实践 — 课程大纲
人工智能