机器学习 day35(决策树)

  1. 决策树
  • 上图的数据集是一个特征值X采用分类值,即只取几个离散值,同时也是一个二元分类任务,即标签Y只有两个值
  • 上图为之前数据集对应的决策树,最顶层的节点称为根节点,椭圆形节点称为决策节点,矩形节点称为叶子节点
  • 决策树学习算法的工作是,在所有可能的决策树中,选择一个在训练集上能表现良好,并能很好的推广到新数据(即交叉验证集和测试集)的决策树
  1. 决策树的学习过程
  • 在构建决策树的过程中,有几个关键决定
  • 决定一:如何选择特征作为每一个节点?决策树算法通过最大化纯度来选择特征作为节点,从而对数据集进行拆分
  • 决定二:什么时候停止拆分?当某个节点处的数据的纯度为100%时,当拆分某个节点后会导致决策树超过最大深度时,当拆分节点后对纯度影响太小时,当某个节点的示例数量太少时
  • 根节点的深度为0,停止拆分的原因是为了确保我们的树不会变得太大和太笨重,保持树很小,就不太容易过拟合
相关推荐
陈奕昆3 分钟前
1.1探索 LLaMA-Factory:大模型微调的一站式解决方案
人工智能·llama·大模型微调
winner88818 分钟前
从 BERT 到 GPT:Encoder 的 “全局视野” 如何喂饱 Decoder 的 “逐词纠结”
人工智能·gpt·bert·encoder·decoder
Humbunklung30 分钟前
Sigmoid函数简介及其Python实现
开发语言·python·深度学习·机器学习
Swee141 分钟前
应对过度处方挑战:为药物推荐任务微调大语言模型(Xiangnan He)
人工智能·语言模型·自然语言处理
dog2501 小时前
BBR 的 RTT 公平性问题求解
人工智能·算法·机器学习
odoo中国1 小时前
机器学习实操 第一部分 机器学习基础 第7章 集成学习与随机森林
随机森林·机器学习·集成学习
X-funbean1 小时前
Multicore-TSNE
机器学习·数据可视化
莱茶荼菜1 小时前
SIFT特征点检测
人工智能·深度学习·计算机视觉
荷塘阅色2 小时前
【机器学习】人工智能在电力电子领域的应用
人工智能·机器学习·电力电子
James. 常德 student2 小时前
长短期记忆网络(LSTM)
人工智能·rnn·lstm