机器学习模型:决策树笔记

第一章:决策树原理 1-决策树算法概述_哔哩哔哩_bilibili

根节点的选择应该用哪个特征?接下来选什么?如何切分?

决策树判断顺序比较重要。可以使用信息增益、信息增益率、

在划分数据集前后信息发生的变化称为信息增益,获得信息增益最高的特征就是最好的选择。集合信息的度量方式称为香农熵,或者简称熵。

常用的决策树算法

连续值应该怎么分?

排序之后二分。

决策树剪枝策略。

决策树有过拟合的风险,理论上可以完全分得开数据(如果树足够庞大,每个叶子节点就一个数据)

剪枝策略

预剪枝:边建立决策树边进行剪枝的操作(更实用)。

限制深度;叶子节点个数;叶子节点样本数;信息增益量等。

后剪枝:当建立完决策树后进行剪枝操作(用的不多)。

相关推荐
虹科数字化与AR4 分钟前
安宝特案例丨AR+AI赋能轨道交通制造:破解人工装配难题的创新实践
人工智能·ar·制造·轨道交通·工业ar·ai辅助·ar工业
陈敬雷-充电了么-CEO兼CTO4 分钟前
字节跳动开源Coze,开启AI Agent开发新时代?
人工智能·gpt·chatgpt·开源·大模型·agi·coze
说私域8 分钟前
基于开源AI智能名片链动2+1模式与S2B2C商城小程序的微商品牌规范化运营研究
人工智能·小程序·开源
强德亨上校11 分钟前
2025年7月21–28日AI开发周报:新模型、新战略与开源亮点
人工智能·科技·gpt·chatgpt·开源·aigc
亚马逊云开发者11 分钟前
Amazon Bedrock Runtime API集成指南——从Invoke Model API迁移到Converse API,简化生成式AI应用开发
人工智能·api
算家计算12 分钟前
FLUX.1 Kontext LoRA专用炼丹炉使用教程:加快训练进程,减少实例费用消耗!
人工智能·开源·aigc
江山如画,佳人北望14 分钟前
pytorch常用函数
人工智能·pytorch·python
DM今天肝到几点?22 分钟前
【7.26-7.28胜算云AI日报:首个开源3D世界生成模型腾讯混元、微软预示 8 月 GPT-5 发布、Nemotron推理、商汤悟能、DM夺金】
人工智能·vscode·microsoft·3d·ai·chatgpt
学术小八29 分钟前
第六届物联网、人工智能与机械自动化国际学术会议 (IoTAIMA 2025)
运维·人工智能·自动化
青梅主码30 分钟前
麦肯锡全球研究院发布《2025 年技术趋势展望》:到 2030 年,半导体行业可能面临显著的人才缺口
人工智能·后端