深度学习 Lecture 8 决策树

一、决策树模型(Decision Tree Model)

椭圆形代表决策节点(decison nodes),矩形节点代表叶节点(leaf nodes),方向上的值代表属性的值,

构建决策树的学习过程:

第一步:决定在根节点上的特征(也就是第一个分开样本的特征)

第二步:决定在内部节点上的特征(第二个、第三个分开样本的特征)

第三步:顺着特征写出特定的值的输出值

第一个问题:如何选择在每个节点上使用划分的特征呢?

尽量要保持最大的纯度(Maximize purity),纯度代表说,尽可能能直接完成分类(也就是尽量把这几个类的子集分开)

第二个问题:什么时候停止划分?

  1. 当一个节点能百分百判断一个类的时候

2.当划分节点将会导致树超过最大深度时

  1. 想避免过拟合时

二、测量纯度(Measuring purity)

熵:对一组数据不纯度的衡量

熵函数一般用H(p_1)表示

可以看到,当样本集是五五开的时候,这条曲线是最高的,也就是熵最大。

相反,如果样本集里都是猫或者都是狗的话,熵为0.

熵函数的方程:

相关推荐
山西茄子1 分钟前
LLM的相关概念
人工智能
ftpeak2 分钟前
LangGraph Agent 开发指南(12~函数式 API)
人工智能·python·ai·langchain·langgraph
闵孚龙3 分钟前
Claude Code Hooks 用户自定义拦截点全解析:AI Agent 自动化、安全治理、插件扩展、可观测性核心机制
人工智能·安全·自动化
天涯明月19936 分钟前
AEnvironment深度研究报告
人工智能·后端·云原生
暗夜猎手-大魔王10 分钟前
HermesAgent上下文学习
人工智能
TTGGGFF11 分钟前
AI摆摊:在 muShanghai × 观猹 AI 练摊集市的一次高密度体验
人工智能
沈浩(种子思维作者)12 分钟前
物理的本质是数学,还是数学只是描述物理的方便之语?
人工智能·python·算法
智流学社12 分钟前
AI 重构产研线:我怎么把角色交接的 40% 信息损耗压到0
人工智能·深度学习·自然语言处理·重构
zhangshuang-peta17 分钟前
一个实战案例:用 MCP 重构一个 OpenClaw + Skill Agent 系统
人工智能·ai agent·mcp·peta
逆境不可逃17 分钟前
Hello-Agents 第二部分-第四章总结:智能体经典范式构建-包含习题解析和Java版
java·开发语言·javascript·人工智能·分布式·agent