机器学习模型:决策树笔记

第一章:决策树原理 1-决策树算法概述_哔哩哔哩_bilibili

根节点的选择应该用哪个特征?接下来选什么?如何切分?

决策树判断顺序比较重要。可以使用信息增益、信息增益率、

在划分数据集前后信息发生的变化称为信息增益,获得信息增益最高的特征就是最好的选择。集合信息的度量方式称为香农熵,或者简称熵。

常用的决策树算法

连续值应该怎么分?

排序之后二分。

决策树剪枝策略。

决策树有过拟合的风险,理论上可以完全分得开数据(如果树足够庞大,每个叶子节点就一个数据)

剪枝策略

预剪枝:边建立决策树边进行剪枝的操作(更实用)。

限制深度;叶子节点个数;叶子节点样本数;信息增益量等。

后剪枝:当建立完决策树后进行剪枝操作(用的不多)。

相关推荐
bing.shao8 分钟前
golang 做AI任务执行
开发语言·人工智能·golang
鼎道开发者联盟21 分钟前
2025中国AI开源生态报告发布,鼎道智联助力产业高质量发展
人工智能·开源·gui
贾维思基21 分钟前
告别RPA和脚本!视觉推理Agent,下一代自动化的暴力解法
人工智能·agent
P-ShineBeam28 分钟前
引导式问答-对话式商品搜索-TRACER
人工智能·语言模型·自然语言处理·知识图谱
j_jiajia28 分钟前
(一)人工智能算法之监督学习——KNN
人工智能·学习·算法
Hcoco_me37 分钟前
大模型面试题62:PD分离
人工智能·深度学习·机器学习·chatgpt·机器人
OpenCSG1 小时前
AgenticOps 如何重构企业 AI 的全生命周期管理体系
大数据·人工智能·深度学习
阿里云大数据AI技术1 小时前
漫画说:为什么你的“增量计算”越跑越慢?——90%的实时数仓团队都踩过的坑,藏在这几格漫画里
大数据·人工智能
Gavin在路上1 小时前
SpringAIAlibaba之上下文工程与GraphRunnerContext 深度解析(8)
人工智能
撬动未来的支点2 小时前
【AI】光速理解YOLO框架
人工智能·yolo·计算机视觉