机器学习sklearn:决策树的参数、属性、接口

决策树有八个参数:Criterion,两个随机性相关的参数(random_state,splitter),五个剪枝参数(max_depth, min_samples_split,min_samples_leaf,max_feature,min_impurity_decrease)

一个属性:feature_importances_

四个接口:fit,score,apply,predict

样例:

python 复制代码
import numpy as np
import pandas as pd
from PIL.ImageColor import colormap
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_wine
from sklearn import tree

wine = load_wine()

Xtrain, Xtest, Ytrain, Ytest = train_test_split(wine.data, wine.target, test_size=0.3)


clf = tree.DecisionTreeClassifier(criterion='entropy'
                                  , random_state=30
                                  , splitter='random'
                                  , min_samples_split=10
                                  , min_samples_leaf=10
                                  , max_depth=10)

clf = clf.fit(Xtrain, Ytrain)
clf.feature_importances_
clf.apply(Xtest)
clf.predict(Xtest)

一、参数

1、criterion

参数默认gini,还有entropy,想要高拟合就用entropy

2、random_state

设置数字就是固定随机选择的种子,每次运行都一样

3、splitter

默认是"best",高拟合

担心拟合高了或特征太多就用"random"

4、max_depth

树生长的最大深度,通常是限制拟合过高的情况

5、min_samples_split,min_samples_leaf

要到min_samples_split个样本才会考虑继续分裂,分裂后的子节点不能少于min_samples_leaf

6、max_features

特征个数

二、属性

1、feature_importances_

显示每个特征的重要性

三、接口

1、fit

训练

2、score

正确率

3、predict

预测结果是哪一组

4、apply

叶子节点的索引

相关推荐
硅谷秋水7 小时前
面向长上下文自动驾驶的规划对齐Token压缩
人工智能·深度学习·机器学习·计算机视觉·自动驾驶
装不满的克莱因瓶10 小时前
【自动驾驶领域】学习 Cityscapes 数据集——城市街景语义理解的标准基准
人工智能·pytorch·python·深度学习·学习·机器学习·自动驾驶
FL162386312910 小时前
户外垃圾类型检测数据集VOC+YOLO格式4278张10类别
人工智能·yolo·机器学习
咋吃都不胖lyh12 小时前
DBSCAN(基于密度的空间聚类应用与噪声)算法
人工智能·机器学习
青山如墨雨如画13 小时前
【北邮-无线通信中的人工智能】物理层技术中AI的应用实践:基于KNN的调制识别(1)理论基础
人工智能·python·机器学习·matlab·jupyter
hsg7713 小时前
简述:2026年中考一地作文题目 :接纳无解,向阳求索
人工智能·机器学习
高洁0115 小时前
医疗行业的数字孪生革命
python·机器学习·数据挖掘·transformer·知识图谱
DXM052116 小时前
第13期|遥感语义分割模型:U-Net核心原理+遥感落地优势
人工智能·python·深度学习·目标检测·随机森林·机器学习·支持向量机
Godspeed Zhao17 小时前
Level 4自动驾驶系统设计1——功能与场景1
人工智能·机器学习·自动驾驶
程序员爱德华18 小时前
计算机视觉-自动驾驶
机器学习·计算机视觉·自动驾驶