有监督学习——决策树

任务

1、基于iris_data.csv数据,建立决策树模型,评估模型表现;

2、可视化决策树结构;

3、修改min_samples_leaf参数,对比模型结果

代码工具:jupyter notebook

参考资料

20.23 决策树(1)_哔哩哔哩_bilibili

21.24 决策树(2)_哔哩哔哩_bilibili

博文:https://www.cnblogs.com/zwh0910/p/18708363

数据准备

数据集名称:iris_data.csv

点我转到百度网盘获取数据集 提取码: 8497

复制代码
#加载数据
import pandas as pd
data = pd.read_csv('iris_data.csv')
data.head()
复制代码
X= data.drop(['target','label'], axis = 1)
y = data.loc[:,'label']
print(X.shape, y.shape) #(150, 4) (150,)

建立模型

复制代码
#建立决策树模型
from sklearn import tree
dc_tree = tree.DecisionTreeClassifier(criterion = 'entropy', min_samples_leaf = 5)
#criterion='entropy'也就是采用ID3。min_samples_leaf:叶子节点最少样本数,少于最少样本数就没必要往下分了。
#决策树分裂出来的叶子最少要有5个样本,如果再往下分发现少于5个样本节点就没有必要往下分了
dc_tree.fit(X, y) #
复制代码
#预测
y_predict = dc_tree.predict(X)

from sklearn.metrics import accuracy_score
accuracy = accuracy_score(y, y_predict)
print(accuracy)#0.9733333333333334

决策树可视化

复制代码
import matplotlib.pyplot as plt
fig1 = plt.figure(figsize=(10,10))
tree.plot_tree(dc_tree, filled=True, feature_names 
               = ['SepalLength', 'SepalWidth', 'PetalLength','PetalLength','PetalWidth']
               , class_names=['setosa','versicolor','virginica'])
#填充底色, 分类名称
# filled=True表示根据不同的分类加上不同的背景颜色。feature_names是修改属性名称。class_names显示输出类别。

plt.show()
相关推荐
爱隐身的官人33 分钟前
爬虫基础学习-链接协议分析,熟悉相关函数
爬虫·学习
GIS小天2 小时前
AI+预测3D新模型百十个定位预测+胆码预测+去和尾2025年8月25日第170弹
人工智能·算法·机器学习·彩票
PAK向日葵3 小时前
【算法导论】XM 0823 笔试题解
算法·面试
岁月栖迟3 小时前
leetcode 49. 字母异位词分组
windows·算法·leetcode
Asmalin3 小时前
【代码随想录day 21】 力扣 77. 组合
算法·leetcode·职场和发展
red_redemption5 小时前
自由学习记录(88)
学习
2501_924878598 小时前
强光干扰下漏检率↓78%!陌讯动态决策算法在智慧交通违停检测的实战优化
大数据·深度学习·算法·目标检测·视觉检测
耳总是一颗苹果9 小时前
排序---插入排序
数据结构·算法·排序算法
YLCHUP9 小时前
【联通分量】题解:P13823 「Diligent-OI R2 C」所谓伊人_连通分量_最短路_01bfs_图论_C++算法竞赛
c语言·数据结构·c++·算法·图论·广度优先·图搜索算法
百分百题库APP9 小时前
江苏安全员 A 证 “安全生产管理” 核心考点
学习·考试·题库·考证