决策树oo

决策树学习的算法通常是一个递归地选择最优特征(选择方法的不同,对应着不同的算法),并根据该特征对训练数据进行分割,使得各个子数据集有一个最好的分类的过程。这一过程对应着对特征空间的划分,也对应着决策树的构建

步骤(译)

从根节点开始

计算所有可能特征的信息增益,并选择信息增益最高的特征

根据选择的特征对数据集进行拆分,并创建树的左右分支

继续重复分割过程,直到满足停止条件:

当一个节点100%是一个类时当分割节点时

将导致树超过最大深度

额外分割的信息增益小于阈值

当一个节点中的样例数量低于阈值时

简单实例

python 复制代码
# 导入所需的库
from sklearn.tree import DecisionTreeClassifier
from sklearn import tree
import matplotlib.pyplot as plt
import numpy as np

# 解决中文乱码问题
plt.rcParams['font.sans-serif']=['SimHei'] 
# 创建训练数据集
X = np.array([[0, 150], [0, 200], [1, 160], [1, 190], [0, 180],
              [1, 140], [1, 210], [0, 175], [0, 220], [1, 165],
              [1, 155], [0, 185], [0, 195], [1, 170], [1, 200]])
y = np.array([0, 0, 1, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1])

# 创建深度等于3的决策树模型
model = DecisionTreeClassifier(max_depth=3)

# 训练模型
model.fit(X, y)

# 可视化生成的决策树
plt.figure(figsize=(12, 8))
tree.plot_tree(model, filled=True, feature_names=["颜色", "重量"], class_names=["苹果", "橙子"])
plt.title("决策树示例")
plt.show()
相关推荐
Dave.B13 分钟前
vtkPolyDataConnectivityFilter 实用指南
算法·vtk
GIS数据转换器14 分钟前
基于AI的低空数联无人机智慧巡查平台
大数据·人工智能·机器学习·无人机·宠物
爱吃rabbit的mq31 分钟前
第2章 机器学习的核心概念(上)
人工智能·机器学习
细节处有神明43 分钟前
开源数据之历史气象数据的获取与使用
人工智能·python·算法
小白开始进步1 小时前
JAKA Zu12 机械臂运动学算法深度解析(含可视化方案)
python·算法·numpy
梵刹古音1 小时前
【C语言】 递归函数
c语言·数据结构·算法
yongui478341 小时前
混凝土二维随机骨料模型 MATLAB 实现
算法·matlab
爱吃泡芙的小白白1 小时前
机器学习输入层:从基础到前沿,解锁模型性能第一关
人工智能·机器学习
酉鬼女又兒1 小时前
JAVA牛客入门11~20
算法