吴恩达机器学习笔记 二十六 决策树学习过程 独热编码one-hot

决策树的学习过程

  1. 所有样本都在根结点

2.计算所有可能的特征的信息增益,选择信息增益最大的那个

3.根据选择的特征分离数据集,创造左右两支子树

4.继续进行分裂直到达到停止标准。停止标准有:一个节点只有一类样本;分裂一个节点会导致树的深度超过最大值;从新的分裂得到的信息增益低于一个阈值;一个节点中的样本数低于一个阈值。

决策树可以看做一个**递归(recursive)**的过程

独热编码one-hot

例如猫狗分类,原本耳朵形状这个特征有三个可能的取值,采用独热编码的方式创建三个新的特征,每个特征只有两种情况(0或1) ,每个特征恰好有一个是1,所以叫独热。也可以推广到其他特征,用0或1来表示特征,可以将数字作为神经网络的输入。

相关推荐
NULL指向我1 分钟前
TMS320F28379D笔记4:CAN通信的收发配置
笔记
疯狂打码的少年1 分钟前
【程序语言与编译】文法的分类(0-3型,乔姆斯基体系)
人工智能·笔记·分类·数据挖掘
小糖学代码8 分钟前
机器学习:6.卷积神经网络与循环神经网络
人工智能·rnn·机器学习·cnn
AOwhisky11 分钟前
Redis 学习笔记(第二期):核心数据类型与消息队列实战
运维·数据库·redis·笔记·学习·云计算
江屿风15 分钟前
C++图论基础拓扑排序算法流食般投喂
开发语言·c++·笔记·算法·排序算法
高洁0121 分钟前
知识图谱与推荐系统实战
深度学习·机器学习·transformer·virtualenv·知识图谱
七夜zippoe24 分钟前
DolphinDB机器学习函数:内置ML能力
人工智能·机器学习·ml·dolphindb·内置
进击切图仔30 分钟前
确保深度神经网络在训练过程中的数值稳定性
人工智能·机器学习·dnn
EQUINOX136 分钟前
【论文阅读】| ViT精读
论文阅读·人工智能·深度学习·机器学习
OSwich38 分钟前
【UE5学习笔记】UMG中控件命名规范
笔记·学习·ue5