深度学习 Lecture 8 决策树

一、决策树模型(Decision Tree Model)

椭圆形代表决策节点(decison nodes),矩形节点代表叶节点(leaf nodes),方向上的值代表属性的值,

构建决策树的学习过程:

第一步:决定在根节点上的特征(也就是第一个分开样本的特征)

第二步:决定在内部节点上的特征(第二个、第三个分开样本的特征)

第三步:顺着特征写出特定的值的输出值

第一个问题:如何选择在每个节点上使用划分的特征呢?

尽量要保持最大的纯度(Maximize purity),纯度代表说,尽可能能直接完成分类(也就是尽量把这几个类的子集分开)

第二个问题:什么时候停止划分?

  1. 当一个节点能百分百判断一个类的时候

2.当划分节点将会导致树超过最大深度时

  1. 想避免过拟合时

二、测量纯度(Measuring purity)

熵:对一组数据不纯度的衡量

熵函数一般用H(p_1)表示

可以看到,当样本集是五五开的时候,这条曲线是最高的,也就是熵最大。

相反,如果样本集里都是猫或者都是狗的话,熵为0.

熵函数的方程:

相关推荐
Leon Cheng3 分钟前
工作流引擎在AI Agent中的应用
大数据·人工智能
华南首席酱油官5 分钟前
精工筑净 标杆引领:净化板厂家赋能净化彩钢板行业新高度
大数据·人工智能
Volunteer Technology16 分钟前
文本处理基本方法和jieba分词
人工智能·nlp
方见华Richard17 分钟前
解构对话本体论:实验设计与认知重构
人工智能·交互·学习方法·原型模式·空间计算
小二·18 分钟前
Python Web 开发进阶实战:AI 智能体操作系统 —— 在 Flask + Vue 中构建多智能体协作与自主决策平台
前端·人工智能·python
GatiArt雷21 分钟前
AI 赋能 Python:基于 LLM + Pandas 的自动化数据清洗实操AI赋能Python数据清洗:基于LLM+Pandas的自动化实操
人工智能·langchain
ApachePulsar22 分钟前
演讲回顾|Apache Pulsar x AI Agent:智能系统消息基础架构
人工智能
速易达网络31 分钟前
工业成品多维检测模型
人工智能
轴测君34 分钟前
CBAM(Convolutional Block Attention Module)
人工智能·pytorch·笔记
汗流浃背了吧,老弟!39 分钟前
基于 BERT 模型实现命名实体识别(NER)任务
人工智能·深度学习·bert