深度学习 Lecture 8 决策树

一、决策树模型(Decision Tree Model)

椭圆形代表决策节点(decison nodes),矩形节点代表叶节点(leaf nodes),方向上的值代表属性的值,

构建决策树的学习过程:

第一步:决定在根节点上的特征(也就是第一个分开样本的特征)

第二步:决定在内部节点上的特征(第二个、第三个分开样本的特征)

第三步:顺着特征写出特定的值的输出值

第一个问题:如何选择在每个节点上使用划分的特征呢?

尽量要保持最大的纯度(Maximize purity),纯度代表说,尽可能能直接完成分类(也就是尽量把这几个类的子集分开)

第二个问题:什么时候停止划分?

  1. 当一个节点能百分百判断一个类的时候

2.当划分节点将会导致树超过最大深度时

  1. 想避免过拟合时

二、测量纯度(Measuring purity)

熵:对一组数据不纯度的衡量

熵函数一般用H(p_1)表示

可以看到,当样本集是五五开的时候,这条曲线是最高的,也就是熵最大。

相反,如果样本集里都是猫或者都是狗的话,熵为0.

熵函数的方程:

相关推荐
红衣小蛇妖6 分钟前
神经网络-Day45
人工智能·深度学习·神经网络
JoannaJuanCV23 分钟前
BEV和OCC学习-5:数据预处理流程
深度学习·目标检测·3d·occ·bev
KKKlucifer23 分钟前
当AI遇上防火墙:新一代智能安全解决方案全景解析
人工智能
DisonTangor1 小时前
【小红书拥抱开源】小红书开源大规模混合专家模型——dots.llm1
人工智能·计算机视觉·开源·aigc
浠寒AI3 小时前
智能体模式篇(上)- 深入 ReAct:LangGraph构建能自主思考与行动的 AI
人工智能·python
weixin_505154463 小时前
数字孪生在建设智慧城市中可以起到哪些作用或帮助?
大数据·人工智能·智慧城市·数字孪生·数据可视化
Best_Me073 小时前
深度学习模块缝合
人工智能·深度学习
YuTaoShao3 小时前
【论文阅读】YOLOv8在单目下视多车目标检测中的应用
人工智能·yolo·目标检测
算家计算4 小时前
字节开源代码模型——Seed-Coder 本地部署教程,模型自驱动数据筛选,让每行代码都精准落位!
人工智能·开源
伪_装4 小时前
大语言模型(LLM)面试问题集
人工智能·语言模型·自然语言处理