实验10决策树

实验10决策树

一、实验目的

(1)理解并熟悉决策树算法思想和原理;

(2)熟悉决策树算法的数学推导过程;

(3)能运用决策树算法解决实际问题并体会算法的效果;

(4)熟悉sklearn与决策树算法相关的机器学习开源库,并使用开源库,对乳腺肿瘤数据进行分类。
二、实验内容

1、使用Python开发工具,运行对iris数据进行分类的例子程序dtree.py,熟悉sklearn机器实习开源库。

使用pycharm运行:

运行结果:

2、登录https://archive-beta.ics.uci.edu/,界面如下:

可以查看提供的各类公共数据源,找到Breast Cancer Wisconsin (Original)数据并下载。也可以直接输入网址:

https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/

下载wisconsin提供的乳腺肿瘤数breast-cancer-wisconsin.data(已经处理好的数据)和breast-cancer-wisconsin.names(对数据的说明,可以用写字体打开)

数据如下:

3、使用sklearn机器学习开源库,使用决策树对breast-cancer-wisconsin.data进行分类。

代码:

运行结果:

4、(选做)用java实现决策树ID3算法,并对上述数据进行分类。

三、实验体会与总结

通过本次决策树算法的实验,掌握了决策树的基本原理和构建过程,在解决乳腺肿瘤数据分类的实际问题中,利用sklearn库高效地构建了决策树模型,从sklearn库导入的多个模块和函数。这些代码被用于处理肿瘤学数据集,并使用交叉验证来评估模型性能,并通过调整参数优化了模型性能。

相关推荐
lqqjuly4 分钟前
低秩分解与低秩适配——从矩阵分析基础到 LoRA/QLoRA
决策树·机器学习·矩阵
alphaTao10 分钟前
LeetCode 每日一题 2026/5/25-2026/5/31
算法·leetcode
菜菜的顾清寒13 分钟前
力扣HOT100(41)动态规划-杨辉三角
算法·leetcode·动态规划
Cthy_hy18 分钟前
Python算法竞赛:集合去重+字典映射 核心用法一站式整理
数据结构·python·算法
高洁0124 分钟前
设备故障?数字孪生提前预警
深度学习·机器学习·数据挖掘·transformer·知识图谱
Deepoch25 分钟前
Deepoc数学大模型:驱动发动机行业数智化转型的底层解
人工智能·算法·deepoc·数学大模型
happymaker062627 分钟前
LeetCodeHot100——盛水最多的容器
数据结构·算法·leetcode·双指针·hot100
3DVisionary28 分钟前
蓝光三维扫描:磁性轴承全尺寸精密3D检测方案
算法·3d·3d检测·蓝光三维扫描·精密检测·磁性轴承·圆度测量
过期动态34 分钟前
【LeetCode 热题 100】三数之和
java·数据结构·算法·leetcode·职场和发展·排序算法
weixin_4684668537 分钟前
机器学习与深度学习新手区分指南
人工智能·python·深度学习·机器学习·计算机视觉·ai·机器视觉