吴恩达机器学习笔记 二十六 决策树学习过程 独热编码one-hot

决策树的学习过程

  1. 所有样本都在根结点

2.计算所有可能的特征的信息增益,选择信息增益最大的那个

3.根据选择的特征分离数据集,创造左右两支子树

4.继续进行分裂直到达到停止标准。停止标准有:一个节点只有一类样本;分裂一个节点会导致树的深度超过最大值;从新的分裂得到的信息增益低于一个阈值;一个节点中的样本数低于一个阈值。

决策树可以看做一个**递归(recursive)**的过程

独热编码one-hot

例如猫狗分类,原本耳朵形状这个特征有三个可能的取值,采用独热编码的方式创建三个新的特征,每个特征只有两种情况(0或1) ,每个特征恰好有一个是1,所以叫独热。也可以推广到其他特征,用0或1来表示特征,可以将数字作为神经网络的输入。

相关推荐
老鱼说AI13 分钟前
BPE编码从零开始实现pytorch
开发语言·人工智能·python·机器学习·chatgpt·nlp·gpt-3
寅双木14 分钟前
自己配一台电脑——显卡
笔记·显卡·显卡电路板·显卡散热·显卡组成·显卡接口·pcle接口
lisw0520 分钟前
边缘计算与云计算!
大数据·人工智能·机器学习·云计算·边缘计算
zenRRan27 分钟前
英伟达提出“思考用扩散,说话用自回归”:实现语言模型效率与质量的双赢!
人工智能·机器学习·语言模型·数据挖掘·回归
梨轻巧40 分钟前
艾伦·索金 编剧课 写作课
笔记
red watchma1 小时前
OTA的HTTP笔记
笔记·网络协议·http
LO嘉嘉VE1 小时前
学习笔记十四:决策树剪枝
决策树·机器学习
('-')1 小时前
《从根上理解MySQL是怎样运行的》第三章学习笔记
笔记·学习·mysql
柳一航2 小时前
HTML笔记
前端·笔记·html
诸葛思颖2 小时前
【论文阅读笔记】FL+HC(联邦学习+层次聚类)
论文阅读·笔记·聚类