吴恩达机器学习笔记 二十六 决策树学习过程 独热编码one-hot

决策树的学习过程

  1. 所有样本都在根结点

2.计算所有可能的特征的信息增益,选择信息增益最大的那个

3.根据选择的特征分离数据集,创造左右两支子树

4.继续进行分裂直到达到停止标准。停止标准有:一个节点只有一类样本;分裂一个节点会导致树的深度超过最大值;从新的分裂得到的信息增益低于一个阈值;一个节点中的样本数低于一个阈值。

决策树可以看做一个**递归(recursive)**的过程

独热编码one-hot

例如猫狗分类,原本耳朵形状这个特征有三个可能的取值,采用独热编码的方式创建三个新的特征,每个特征只有两种情况(0或1) ,每个特征恰好有一个是1,所以叫独热。也可以推广到其他特征,用0或1来表示特征,可以将数字作为神经网络的输入。

相关推荐
这张生成的图像能检测吗5 小时前
(论文速读)GraphSAGE:大型图的归纳表示学习
人工智能·深度学习·机器学习·图神经网络·无监督学习
才不做选择12 小时前
基于 YOLOv8 的水果智能识别系统
python·yolo·目标检测·机器学习·计算机视觉
the4thone12 小时前
AI基础 笔记
人工智能·笔记
im_AMBER13 小时前
Leetcode 93 找出临界点之间的最小和最大距离
c++·笔记·学习·算法·leetcode
jimmyleeee13 小时前
人工智能基础知识笔记三十一:Langfuse的几种tracing的方法
人工智能·笔记
算法与编程之美13 小时前
探索多个卷积层的卷积神经网络
人工智能·深度学习·神经网络·机器学习·cnn
日更嵌入式的打工仔16 小时前
Ehercat代码解析中文摘录<3>
笔记·ethercat
玄同76516 小时前
Python 系统编程双雄:sys 与 os 模块深度实践指南
开发语言·数据库·人工智能·windows·笔记·python·microsoft
航Hang*17 小时前
第六章:网络系统建设与运维(高级)—— STP生成树协议
运维·服务器·网络·笔记·ensp
pps-key17 小时前
ai交易算力研究
大数据·jvm·人工智能·机器学习