深度学习 Lecture 8 决策树

一、决策树模型(Decision Tree Model)

椭圆形代表决策节点(decison nodes),矩形节点代表叶节点(leaf nodes),方向上的值代表属性的值,

构建决策树的学习过程:

第一步:决定在根节点上的特征(也就是第一个分开样本的特征)

第二步:决定在内部节点上的特征(第二个、第三个分开样本的特征)

第三步:顺着特征写出特定的值的输出值

第一个问题:如何选择在每个节点上使用划分的特征呢?

尽量要保持最大的纯度(Maximize purity),纯度代表说,尽可能能直接完成分类(也就是尽量把这几个类的子集分开)

第二个问题:什么时候停止划分?

  1. 当一个节点能百分百判断一个类的时候

2.当划分节点将会导致树超过最大深度时

  1. 想避免过拟合时

二、测量纯度(Measuring purity)

熵:对一组数据不纯度的衡量

熵函数一般用H(p_1)表示

可以看到,当样本集是五五开的时候,这条曲线是最高的,也就是熵最大。

相反,如果样本集里都是猫或者都是狗的话,熵为0.

熵函数的方程:

相关推荐
大佬喝可乐几秒前
卷积神经网络(CNN)全面解析
人工智能·神经网络·cnn
martinzh6 分钟前
上下文学习的神奇魔法:轻松理解AI如何无师自通
人工智能
Hcoco_me20 分钟前
【4】Transformers快速入门:自然语言模型 vs 统计语言模型
人工智能·语言模型·自然语言处理
机器之心37 分钟前
Agent狂欢下的冷思考:为什么说Data&AI数据基础设施,才是AI时代Infra新范式
人工智能·openai
不焦躁的程序员40 分钟前
选择gpt-5还是claude-4-sonnect
人工智能·gpt·cursor
算家计算1 小时前
阿里开源首个图像生成基础模型——Qwen-Image本地部署教程,超强中文渲染能力刷新SOTA!
人工智能·开源·aigc
汀丶人工智能1 小时前
AI Compass前沿速览:RynnVLA视觉-语言-动作模型、GLM-4.5V 、DreamVVT虚拟换衣、 WeKnora框架、GitMCP、Neural
人工智能
聚客AI1 小时前
👉FastMCP深度解析:ctx.sample() 如何实现LLM任务逆向委托
人工智能·llm·mcp
京东零售技术1 小时前
Text2SQL准确率暴涨22.6%!3大维度全拆
人工智能
去伪存真1 小时前
手把手教你实现用AI大模型做代码审查
前端·人工智能