机器学习(五)--决策树

决策树

一种对实例进行分类 的树形结构,通过多层判断区分目标所属类别本质:通过多层判断,从训练数据集中归纳出一组分类规则。

优点:

➤ 计算量小,运算速度快

➤ 易于理解,可清晰查看各属性的重要性

缺点:

➤ 忽略属性间的相关性

➤ 样本类别分布不均匀时,容易影响模型表现

不同特征建立不同的决策树

决策树的构造

ID3利用信息熵原理选择信息增益最大的属性作为分类属性,递归地拓展决策树的分枝,完成决策树的构造

信息熵(entropy)是度量随机变量不确定性 的指标,熵越大,变量的不确定性就越大。

追问1:没太理解信息熵的,举个例子说明

追问2:知道了信息熵,那他对决策树有什么用处呢?

比如说以下是一个判读是否适合学习ai课程的决策树,我们要从哪个特征开始算起呢,这时候就要计算信息熵与信息增益

ID 动力 想提升能力 有兴趣 时间 类别
1 一般
2 一般
3 很强
4 一般
5 一般
6 一般
7 一般
8 一般
9 很强
10 很弱

按照以上步骤分别计算各类特征

特征 信息增益值
有兴趣 0.6100
想提升能力 0.4200
时间 0.4200
动力 0.3668

在本次计算中,"有兴趣" 的信息增益最大(0.6100),因此决策树会优先选择 "有兴趣" 作为根节点的分裂特征。

相关推荐
AI科技星4 分钟前
《全域数学》第一部 数术本源 第三卷 代数原本第14篇 附录二 猜想证明【乖乖数学】
人工智能·算法·数学建模·数据挖掘·量子计算
XD7429716364 分钟前
科技早报|2026年5月2日:AI 编程工具开始按用量收费
人工智能·科技·ai编程·github copilot·科技早报
liangdabiao5 分钟前
乐高摩托车深度报告-致敬张雪夺冠 -基于llm-wiki技术自动化写文章的效果
运维·人工智能·自动化
KC2707 分钟前
Prompt 注入攻击的 5 种姿势和防御指南
人工智能
不懒不懒9 分钟前
【从零入门本地大模型:Ollama 安装部署 + Qwen2.5 实现零样本情感分类】
人工智能·分类·数据挖掘·大模型·ollama
徐健峰13 分钟前
GPT-image-2 热门玩法实战(二):AI 面相分析 & 个人色彩诊断 — 上传自拍秒出专业报告
人工智能·gpt
冰西瓜60014 分钟前
深度学习的数学原理(三十二)—— Transformer全场景掩码机制详解
人工智能·深度学习·transformer
绘梨衣54715 分钟前
Agentic RAG、传统RAG、ReAct、Function Calling 核心关系
人工智能·chatgpt·tensorflow
玩转单片机与嵌入式18 分钟前
嵌入式AI场景:哪些应用场景不适合将AI模型部署到单片机(MCU)中?
人工智能·单片机·嵌入式硬件
MediaTea22 分钟前
AI 术语通俗词典:随机搜索
人工智能