深度学习 Lecture 8 决策树

一、决策树模型(Decision Tree Model)

椭圆形代表决策节点(decison nodes),矩形节点代表叶节点(leaf nodes),方向上的值代表属性的值,

构建决策树的学习过程:

第一步:决定在根节点上的特征(也就是第一个分开样本的特征)

第二步:决定在内部节点上的特征(第二个、第三个分开样本的特征)

第三步:顺着特征写出特定的值的输出值

第一个问题:如何选择在每个节点上使用划分的特征呢?

尽量要保持最大的纯度(Maximize purity),纯度代表说,尽可能能直接完成分类(也就是尽量把这几个类的子集分开)

第二个问题:什么时候停止划分?

  1. 当一个节点能百分百判断一个类的时候

2.当划分节点将会导致树超过最大深度时

  1. 想避免过拟合时

二、测量纯度(Measuring purity)

熵:对一组数据不纯度的衡量

熵函数一般用H(p_1)表示

可以看到,当样本集是五五开的时候,这条曲线是最高的,也就是熵最大。

相反,如果样本集里都是猫或者都是狗的话,熵为0.

熵函数的方程:

相关推荐
AWS官方合作商5 分钟前
AWS Bedrock:开启企业级生成式AI的钥匙【深度解析】
大数据·人工智能·aws
神经星星6 分钟前
【vLLM 学习】API 客户端
数据库·人工智能·机器学习
星江月11 分钟前
EchoMimic 音频驱动照片生成视频部署测试
人工智能·echomimic·语音生成视频
剑盾云安全专家15 分钟前
AI制作PPT,如何轻松打造高效演示文稿
人工智能·科技·aigc·powerpoint·软件
进来有惊喜35 分钟前
OpenCV 表情识别
人工智能·opencv·计算机视觉
Eavan努力努力再努力38 分钟前
[目标检测]2023ICCV:DiffusionDet: Diffusion Model for Object Detection
人工智能·目标检测·计算机视觉
进来有惊喜42 分钟前
opencv指纹匹配
人工智能·opencv·计算机视觉
啊哈哈哈哈哈啊哈哈1 小时前
R3打卡——tensorflow实现RNN心脏病预测
人工智能·深度学习·学习
量子-Alex1 小时前
顶刊【遥感目标检测】【TGRS】LSKF-YOLO:面向高分辨率卫星遥感影像电力塔检测的大规模选择性核特征融合网络
人工智能·yolo·目标检测
知来者逆1 小时前
计算机视觉——深度学习图像处理中目标检测平均精度均值(mAP)与其他常用评估指标
图像处理·深度学习·目标检测·计算机视觉·map