深度学习 Lecture 8 决策树

一、决策树模型(Decision Tree Model)

椭圆形代表决策节点(decison nodes),矩形节点代表叶节点(leaf nodes),方向上的值代表属性的值,

构建决策树的学习过程:

第一步:决定在根节点上的特征(也就是第一个分开样本的特征)

第二步:决定在内部节点上的特征(第二个、第三个分开样本的特征)

第三步:顺着特征写出特定的值的输出值

第一个问题:如何选择在每个节点上使用划分的特征呢?

尽量要保持最大的纯度(Maximize purity),纯度代表说,尽可能能直接完成分类(也就是尽量把这几个类的子集分开)

第二个问题:什么时候停止划分?

  1. 当一个节点能百分百判断一个类的时候

2.当划分节点将会导致树超过最大深度时

  1. 想避免过拟合时

二、测量纯度(Measuring purity)

熵:对一组数据不纯度的衡量

熵函数一般用H(p_1)表示

可以看到,当样本集是五五开的时候,这条曲线是最高的,也就是熵最大。

相反,如果样本集里都是猫或者都是狗的话,熵为0.

熵函数的方程:

相关推荐
yyuuuzz2 分钟前
AI模型部署中的常见稳定性问题
运维·服务器·网络·数据库·人工智能·云计算·github
完成大叔2 分钟前
模块二,Agent个性化模式的四个思考
人工智能
ylscode3 分钟前
HexStrike AI v6.0 深度解析:MCP协议驱动的网络安全自动化框架与红队规避实战
网络·人工智能·安全·安全威胁分析
沸点小助手3 分钟前
「年中FLAG清单 & 谁还没被AI坑过」获奖名单公示|本周互动话题上新🎊
人工智能
K姐研究社4 分钟前
7大真实任务实测 Opus 4.8、Gemini 3.5 Flash、GPT-5.5、Qwen3.7-Max
人工智能·gpt
jinxindeep6 分钟前
EgoLive:面向机器人操作学习的超大规模第一视角数据集
人工智能·学习·机器人
dongf20199 分钟前
R语言决策树剪枝----泰坦尼克数据集
决策树·r语言·剪枝
Biomamba生信基地10 分钟前
AI虚拟细胞干扰工具大测评
人工智能·ai·生物信息学·测评·虚拟细胞
Kobebryant-Manba12 分钟前
记录正则化
人工智能·深度学习·机器学习
哈哈,柳暗花明13 分钟前
人工智能专业术语详解(I)
人工智能·专业术语