决策树 (人工智能期末复习)

几个重要概念

  • 信息熵:随机事件未按照某个属性的不同取值划分时的熵减去按照某个属性的不同取值划分时的平均

    熵。即前后两次熵的差值。

    表示事物的混乱程度,熵越大表示混乱程度越大,越小表示混乱程度越小。

    对于随机事件,如果它的取值有N种情况,每种情况发生的概率为P,那么这件事的熵为:

  • 信息增益:

  • 信息增益率:

    使用信息增益比上训练数据集D关于特征A的值的熵

  • 基尼系数

例题

其实主要还是背公式+计算不出错,等我考完另一门试再写。

(20年)设训练集如下表所示,请用经典的 ID3 算法完成其学习过程。


(19年)下表给出外国菜是否有吸引力的数据集,每个菜品有 3 个属性"温度"、"口味","份量",请用决策树算法画出决策树(根据信息增益)。并预测 dish= {温度=热,口味=甜,份量=大} 的一道菜,是否具有吸引力。


(18年)下表为是否适合打垒球的决策表,请用决策树算法画出决策树,并请预测 E= {天气=晴,温度=适中,湿度=正常,风速=弱} 的场合,是否合适打垒球。


(17年)设使用ID3算法进行归纳学习的输入实例集S={ i | 1≤ i ≤ 7 }如下表所示。学习的目标是用属性A、B、C预测属性F。

(1)写出集合S分别以属性A、B、C作为测试属性的熵的增益Gain(S, A)、Gain(S, B)、Gain(S, C)的表达式。

(2)属性A、B、C中哪个应该作为决策树根节点的测试属性?


考虑下面一个数据集,它记录了某学生多次考试的情况,请根据提供的数据按要求构建决策树。

(1)根据信息增益率选择第一个属性,构建一个深度为1的决策树(根结点深度为1)。

(2)根据信息增益率构建完整的决策树。请回答,这两个决策树的决策结果是否和训练数据一致,并解释说明。

设样本集合如下表格,其中A、B、C是F的属性,请根据信息增益标准(ID3算法),画出F的决策树。

相关推荐
诚思报告YH15 分钟前
生物制剂与生物类似药市场洞察:2026-2032年复合增长率(CAGR)为8.1%
大数据·人工智能·microsoft
得一录17 分钟前
AI面试·高难度题
人工智能·面试·职场和发展
眼镜哥(with glasses)22 分钟前
Steel Division 2(钢铁之师 2)第一次MOD 制作步骤
人工智能
向量引擎小橙27 分钟前
视觉艺术的“奇点”:深度拆解 Gemini-3-Pro-Image-Preview 绘画模型,看这只“香蕉”如何重塑 AI 创作逻辑!
人工智能·python·gpt·深度学习·llama
AI周红伟29 分钟前
周红伟:数字人智能体构建实操,《数字人智能体部署应用:数字人大模型和智能体+Skills+RAG+Agent+Claude Code的部署应用案例实操》
人工智能
KG_LLM图谱增强大模型40 分钟前
人工智能本体论:大模型辅助构建AI概念层级体系
人工智能
Web3VentureView41 分钟前
X Space AMA回顾|预测熊市底部:当市场寻找价格,SYNBO正在构建未来
人工智能·物联网·金融·web3·区块链
SmartBrain1 小时前
Python 特性(第一部分):知识点讲解(含示例)
开发语言·人工智能·python·算法
byzh_rc2 小时前
[深度学习网络从入门到入土] 网络中的网络NiN
网络·人工智能·深度学习
AI周红伟2 小时前
周红伟:企业智能体构建实操,《下一代智能体:Claude code+Skills+Gemini+RAG+Agent智能体构建案例实操》
人工智能