吴恩达机器学习笔记二十四决策树模型学习过程什么时候停止分裂如何选择结点特征

爱学习的小仙女！2024-03-18 21:17

案例：识别小猫，上面这个分类的特征 x 采用分类值（几个离散的值）

决策树最顶端的结点称根结点(root node)，除了根结点和叶子结点之外的叫决策结点(decision node)，最底层的叫叶子结点(leaf node)，叶子结点做出预测

决策树的学习过程

确定根结点使用什么特征，分类后再选一个特征进行分类，直到分出的一组中都是同一类了结束。

问题1：怎么选择决策结点使用的特征？

要选能使纯度（一个子集更接近完全是狗，或者更接近完全是猫）最大的那个

问题2：什么时候停止分裂？

当一个结点完全只有一类东西时；当再分出来结点会导致树超过最大深度时（树的深度从0开始）；当纯度分数的提升在一个阈值下时（再分裂也提升不了多少）；当一个结点的样本数低于一个阈值时。

保持树不太深有两个原因：一是为了快，另一个是这样不太容易过拟合

上一篇：Day38-50-200台中等规模集群架构搭建开始

下一篇：PHP 生成图片

热门推荐

01如何新建文件夹？电脑新建文件夹的4种方法 02GitHub 镜像站点 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05AI科技热点日报 | 2026年07月01日 06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 102026 年 AI 大模型 & AI 编程工具实战全总结