机器学习模型:决策树笔记

第一章:决策树原理 1-决策树算法概述_哔哩哔哩_bilibili

根节点的选择应该用哪个特征?接下来选什么?如何切分?

决策树判断顺序比较重要。可以使用信息增益、信息增益率、

在划分数据集前后信息发生的变化称为信息增益,获得信息增益最高的特征就是最好的选择。集合信息的度量方式称为香农熵,或者简称熵。

常用的决策树算法

连续值应该怎么分?

排序之后二分。

决策树剪枝策略。

决策树有过拟合的风险,理论上可以完全分得开数据(如果树足够庞大,每个叶子节点就一个数据)

剪枝策略

预剪枝:边建立决策树边进行剪枝的操作(更实用)。

限制深度;叶子节点个数;叶子节点样本数;信息增益量等。

后剪枝:当建立完决策树后进行剪枝操作(用的不多)。

相关推荐
seaeress7 分钟前
opencv(C++)处理图像颜色
c++·人工智能·opencv
一尘之中10 分钟前
耳根圆通与禅定的交融与分野
人工智能
结冰架构1 小时前
【AI提示词】Emoji风格排版艺术与设计哲学
大数据·人工智能·ai·提示词
zandy10111 小时前
飞书集成衡石ChatBot实战:如何10分钟搭建一个业务数据问答机器人?
大数据·人工智能·机器人·飞书·chatbot·衡石科技
机器之心1 小时前
200B参数击败满血DeepSeek-R1,字节豆包推理模型Seed-Thinking-v1.5要来了
人工智能
James. 常德 student1 小时前
CV - 目标检测
人工智能·目标检测·计算机视觉
说私域1 小时前
开源AI大模型AI智能名片S2B2C商城小程序:科技浪潮下的商业新引擎
人工智能·小程序·开源·产品运营·零售
_一条咸鱼_2 小时前
深入剖析 AI 大模型的 Embeddings 原理
人工智能·深度学习·机器学习
davysiao2 小时前
从 SaaS 到 MCP:构建 AI Agent 生态的标准化服务升级之路
人工智能
搞程序的心海2 小时前
OpenCV 进阶实战与技巧——图像处理的全面解析
图像处理·人工智能·opencv