机器学习 day35(决策树)

  1. 决策树
  • 上图的数据集是一个特征值X采用分类值,即只取几个离散值,同时也是一个二元分类任务,即标签Y只有两个值
  • 上图为之前数据集对应的决策树,最顶层的节点称为根节点,椭圆形节点称为决策节点,矩形节点称为叶子节点
  • 决策树学习算法的工作是,在所有可能的决策树中,选择一个在训练集上能表现良好,并能很好的推广到新数据(即交叉验证集和测试集)的决策树
  1. 决策树的学习过程
  • 在构建决策树的过程中,有几个关键决定
  • 决定一:如何选择特征作为每一个节点?决策树算法通过最大化纯度来选择特征作为节点,从而对数据集进行拆分
  • 决定二:什么时候停止拆分?当某个节点处的数据的纯度为100%时,当拆分某个节点后会导致决策树超过最大深度时,当拆分节点后对纯度影响太小时,当某个节点的示例数量太少时
  • 根节点的深度为0,停止拆分的原因是为了确保我们的树不会变得太大和太笨重,保持树很小,就不太容易过拟合
相关推荐
拓端研究室6 分钟前
专题:2025人形机器人与服务机器人技术及市场报告|附130+份报告PDF汇总下载
大数据·人工智能
Ray Song8 分钟前
自动驾驶数据闭环
人工智能·机器学习·自动驾驶·数据闭环
aneasystone本尊19 分钟前
学习 Coze Studio 的智能体会话接口
人工智能
高效匠人27 分钟前
能力评估:如何系统评估你的技能和经验
人工智能
小马敲马40 分钟前
[4.2-2] NCCL新版本的register如何实现的?
开发语言·c++·人工智能·算法·性能优化·nccl
阿里云大数据AI技术42 分钟前
【新模型速递】PAI-Model Gallery云上一键部署gpt-oss系列模型
人工智能·gpt·llm
martinzh44 分钟前
AI智能体如何从错误中学习:反思机制详解
人工智能
duration~1 小时前
SpringAI实现Reread(Advisor)
java·人工智能·spring boot·spring
攻城狮7号1 小时前
MiniCPM-V 4.0开源,号称是手机上的GPT-4V
人工智能·开源大模型·openbmb·端侧大模型·minicpm-v-4