吴恩达机器学习笔记 二十六 决策树学习过程 独热编码one-hot

决策树的学习过程

  1. 所有样本都在根结点

2.计算所有可能的特征的信息增益,选择信息增益最大的那个

3.根据选择的特征分离数据集,创造左右两支子树

4.继续进行分裂直到达到停止标准。停止标准有:一个节点只有一类样本;分裂一个节点会导致树的深度超过最大值;从新的分裂得到的信息增益低于一个阈值;一个节点中的样本数低于一个阈值。

决策树可以看做一个**递归(recursive)**的过程

独热编码one-hot

例如猫狗分类,原本耳朵形状这个特征有三个可能的取值,采用独热编码的方式创建三个新的特征,每个特征只有两种情况(0或1) ,每个特征恰好有一个是1,所以叫独热。也可以推广到其他特征,用0或1来表示特征,可以将数字作为神经网络的输入。

相关推荐
做cv的小昊4 小时前
【TJU】信息检索与分析课程笔记和练习(1)认识文献
经验分享·笔记·学习·搜索引擎·全文检索
weixin_409383124 小时前
在kaggle训练Qwen/Qwen2.5-1.5B-Instruct 通过中二时期qq空间记录作为训练数据 训练出中二的模型为目标 第一次训练 好像太二了
人工智能·深度学习·机器学习·qwen
长桥夜波4 小时前
【第二十四周】文献阅读-第一人称下的手势识别(1)
机器学习
图像生成小菜鸟4 小时前
Score Based diffusion model 数学推导
算法·机器学习·概率论
读创商闻4 小时前
崇明岛西滩湿地:离都市最近的候鸟观测笔记
笔记
蒙奇D索大4 小时前
【11408学习记录】考研英语长难句拆解三步法:三步拆解2020年真题,攻克阅读难点
笔记·学习·考研·改行学it
悠闲漫步者4 小时前
第2章 MCS-51单片机的串口和最小系统(学习笔记)
笔记·学习·51单片机
莫白媛5 小时前
Linux创作笔记综合汇总篇
linux·运维·笔记
Wpa.wk5 小时前
Tomcat的安装与部署使用 - 说明版
java·开发语言·经验分享·笔记·tomcat
Vincent_Zhang2335 小时前
专题:所有状语类型(持续补充)
笔记