8.18 机器学习-决策树(1)

决策树

1. 树模型本质

分类/回归:数据从根节点→叶子节点逐步决策,最终落在叶子节点。

2. 树的组成

根节点:第一个分裂的选择点。

非叶子节点:中间判断条件的过程。

叶子节点:最终决策的结果。

3. 训练 vs 测试

训练阶段:用训练集选择特征、切分节点。

测试阶段:按已建好的树路径直接进行预测。

4. 特征选择标准

熵:衡量数据不确定性(熵越低→数据不确定性越小)。

信息增益:特征分裂后熵的不确定减少的程度(增益越大→特征越优)。

5. 构造实例(以"14天打球"为例)

步骤:

  1. 计算原始熵(9打球/5不打球 → 熵=0.940)。

  2. 计算各特征(如Outlook)的条件熵和信息增益。

  3. 选增益最大的特征作为根节点,递归生成子树。

课堂练习:通过数据集构造决策树

1、总熵

E(D)=−k∑​plog2​(p​)

(属于鱼类=是):2个(1、2)

(属于鱼类=否):3个(3、4、5)

熵≈0.971

2、信息增益

:3(1、2、3)

熵:−(32​log2​32​+31​log2​31​)≈0.918

:2(4、5)

熵:0

信息增益=0.420

相关推荐
q_30238195563 分钟前
从训练到部署:香橙派atlas310 YOLOv11 实现 SAR 船舶高效分割全流程实操指南
人工智能·yolo·目标检测·目标分割
熬夜敲代码的小N5 分钟前
基于Unity开发Pico VR眼镜基础应用:从环境搭建到实战部署全解析
人工智能·unity·游戏引擎·vr
川西胖墩墩6 分钟前
数字分身的身份连续性与伦理边界
人工智能
大模型任我行6 分钟前
腾讯:动态树强化学习框架DART
人工智能·语言模型·自然语言处理·论文笔记
aosky6 分钟前
Vercel Labs agent-browser 深度测评:AI时代的浏览器自动化利器
运维·人工智能·自动化·agent-browser
海棠AI实验室7 分钟前
第0章|栏目简介:把 Mac M2 Ultra 变成“家庭私有 AI 生产机房”
人工智能·mac·comfyui·rag
落雨盛夏7 分钟前
深度学习|李哥0
人工智能·深度学习
技术大咖--上好嘉12 分钟前
智慧康养服务:AI科技守护 +“活着安心”,让晚年生活更有底气
人工智能·ai·健康医疗
工藤学编程13 分钟前
零基础学AI大模型之LLM存储记忆功能之BaseChatMemory
人工智能
AI营销资讯站14 分钟前
原圈科技AI营销专家韩剑:不懂AI营销,将错失2026增长先机
人工智能·搜索引擎