机器学习 day35（决策树）

丿罗小黑2023-09-21 15:07

决策树

上图的数据集是一个特征值X采用分类值，即只取几个离散值，同时也是一个二元分类任务，即标签Y只有两个值
上图为之前数据集对应的决策树，最顶层的节点称为根节点，椭圆形节点称为决策节点，矩形节点称为叶子节点
决策树学习算法的工作是，在所有可能的决策树中，选择一个在训练集上能表现良好，并能很好的推广到新数据（即交叉验证集和测试集）的决策树

决策树的学习过程

在构建决策树的过程中，有几个关键决定
决定一：如何选择特征作为每一个节点？决策树算法通过最大化纯度来选择特征作为节点，从而对数据集进行拆分
决定二：什么时候停止拆分？当某个节点处的数据的纯度为100%时，当拆分某个节点后会导致决策树超过最大深度时，当拆分节点后对纯度影响太小时，当某个节点的示例数量太少时
根节点的深度为0，停止拆分的原因是为了确保我们的树不会变得太大和太笨重，保持树很小，就不太容易过拟合

上一篇：单片机操作系统，按键与FIFO

下一篇：基于STC15单片机-LM35-DS8B20温度测量-DS1302计时-proteus仿真-源程序

热门推荐

01全球最强模型Grok4，国内已可免费使用！（附教程）02UV安装并设置国内源 03Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 04[已解决]VSCode右键菜单消失恢复 05🚀Cursor CLI+GPT-5保姆级教程+编程能力测评！Cursor CLI零成本免费使用GPT-5！Claude Code的劲敌来了！从安装到实战演示 06GPT-5 使用限制与国内升级全攻略（免费 / Plus / Pro）【2025 最新】072025最新国内服务器可用docker源仓库地址大全（2025年8月更新）08Cursor 终端“卡死/无响应”问题的解法 09KGG转MP3工具|非KGM文件|解密音频 10OpenAI重返开源！GPT-OSS本地部署完全指南