实验10决策树

实验10决策树

一、实验目的

(1)理解并熟悉决策树算法思想和原理;

(2)熟悉决策树算法的数学推导过程;

(3)能运用决策树算法解决实际问题并体会算法的效果;

(4)熟悉sklearn与决策树算法相关的机器学习开源库,并使用开源库,对乳腺肿瘤数据进行分类。
二、实验内容

1、使用Python开发工具,运行对iris数据进行分类的例子程序dtree.py,熟悉sklearn机器实习开源库。

使用pycharm运行:

运行结果:

2、登录https://archive-beta.ics.uci.edu/,界面如下:

可以查看提供的各类公共数据源,找到Breast Cancer Wisconsin (Original)数据并下载。也可以直接输入网址:

https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/

下载wisconsin提供的乳腺肿瘤数breast-cancer-wisconsin.data(已经处理好的数据)和breast-cancer-wisconsin.names(对数据的说明,可以用写字体打开)

数据如下:

3、使用sklearn机器学习开源库,使用决策树对breast-cancer-wisconsin.data进行分类。

代码:

运行结果:

4、(选做)用java实现决策树ID3算法,并对上述数据进行分类。

三、实验体会与总结

通过本次决策树算法的实验,掌握了决策树的基本原理和构建过程,在解决乳腺肿瘤数据分类的实际问题中,利用sklearn库高效地构建了决策树模型,从sklearn库导入的多个模块和函数。这些代码被用于处理肿瘤学数据集,并使用交叉验证来评估模型性能,并通过调整参数优化了模型性能。

相关推荐
苏州知芯传感14 小时前
当AI遇见MEMS:机器学习如何优化微振镜的控制与可靠性预测
人工智能·机器学习·3d·mems·微振镜
roman_日积跬步-终至千里14 小时前
【模式识别与机器学习(10)】数据预处理-第二部分:数据预处理核心方法
人工智能·机器学习
CoderYanger14 小时前
动态规划算法-简单多状态dp问题:15.买卖股票的最佳时机含冷冻期
开发语言·算法·leetcode·动态规划·1024程序员节
Xの哲學14 小时前
Linux RTC深度剖析:从硬件原理到驱动实践
linux·服务器·算法·架构·边缘计算
狐5714 小时前
2025-12-04-牛客刷题笔记-25_12-4-质数统计
笔记·算法
小O的算法实验室14 小时前
2024年IEEE IOTJ SCI2区TOP,基于混合算法的水下物联网多AUV未知环境全覆盖搜索方法,深度解析+性能实测
算法·论文复现·智能算法·智能算法改进
洲星河ZXH15 小时前
Java,比较器
java·开发语言·算法
CoderYanger15 小时前
递归、搜索与回溯-FloodFill:33.太平洋大西洋水流问题
java·算法·leetcode·1024程序员节
CodeByV15 小时前
【算法题】双指针(二)
数据结构·算法
Jerryhut15 小时前
sklearn函数总结四——归一化和标准化
人工智能·python·机器学习·jupyter·sklearn