机器学习模型:决策树笔记

第一章:决策树原理 1-决策树算法概述_哔哩哔哩_bilibili

根节点的选择应该用哪个特征?接下来选什么?如何切分?

决策树判断顺序比较重要。可以使用信息增益、信息增益率、

在划分数据集前后信息发生的变化称为信息增益,获得信息增益最高的特征就是最好的选择。集合信息的度量方式称为香农熵,或者简称熵。

常用的决策树算法

连续值应该怎么分?

排序之后二分。

决策树剪枝策略。

决策树有过拟合的风险,理论上可以完全分得开数据(如果树足够庞大,每个叶子节点就一个数据)

剪枝策略

预剪枝:边建立决策树边进行剪枝的操作(更实用)。

限制深度;叶子节点个数;叶子节点样本数;信息增益量等。

后剪枝:当建立完决策树后进行剪枝操作(用的不多)。

相关推荐
沉默媛13 小时前
什么是Hinge损失函数
人工智能·损失函数
北青网快讯13 小时前
声网AI技术赋能,智能客服告别机械式应答
人工智能
机器之心13 小时前
TypeScript超越Python成GitHub上使用最广语言,AI是主要驱动力
人工智能·openai
nju_spy13 小时前
周志华《机器学习导论》第 15 章 规则学习(符号主义学习)
人工智能·机器学习·数理逻辑·序贯覆盖·规则学习·ripper·一阶规则学习
许泽宇的技术分享14 小时前
当 AI 工作流需要“人类智慧“:深度解析 Microsoft Agent Framework 的人工接入机制
人工智能·microsoft
antonytyler14 小时前
机器学习实践项目(二)- 房价预测增强篇 - 特征工程四
人工智能·python·机器学习
飞哥数智坊15 小时前
TRAE SOLO 正式版上线,限时免费活动开启
人工智能·trae·solo
Danceful_YJ15 小时前
34.来自Transformers的双向编码器表示(BERT)
人工智能·深度学习·bert
love530love15 小时前
【笔记】xFormers版本与PyTorch、CUDA对应关系及正确安装方法详解
人工智能·pytorch·windows·笔记·python·深度学习·xformers
中科岩创15 小时前
某地公园桥梁自动化监测服务项目
大数据·人工智能·物联网·自动化