吴恩达机器学习笔记 二十六 决策树学习过程 独热编码one-hot

决策树的学习过程

  1. 所有样本都在根结点

2.计算所有可能的特征的信息增益,选择信息增益最大的那个

3.根据选择的特征分离数据集,创造左右两支子树

4.继续进行分裂直到达到停止标准。停止标准有:一个节点只有一类样本;分裂一个节点会导致树的深度超过最大值;从新的分裂得到的信息增益低于一个阈值;一个节点中的样本数低于一个阈值。

决策树可以看做一个**递归(recursive)**的过程

独热编码one-hot

例如猫狗分类,原本耳朵形状这个特征有三个可能的取值,采用独热编码的方式创建三个新的特征,每个特征只有两种情况(0或1) ,每个特征恰好有一个是1,所以叫独热。也可以推广到其他特征,用0或1来表示特征,可以将数字作为神经网络的输入。

相关推荐
是上好佳佳佳呀43 分钟前
【数据分析|Day02】Matplotlib 数据可视化笔记
笔记·matplotlib
三品吉他手会点灯9 小时前
C语言学习笔记 - 44.运算符和表达式 - 运算符2 - 除法与取余运算符
c语言·开发语言·笔记·算法
2601_colin9 小时前
Codex插件全流程实战指南
开发语言·经验分享·笔记·微信开放平台
疯狂打码的少年10 小时前
输入输出控制方式:DMA(直接存储器存取)
网络·笔记
cuso4win10 小时前
Feed 流面试笔记
笔记·面试·职场和发展
wubba lubba dub dub75011 小时前
第四十九周学习周报
人工智能·算法·机器学习
装不满的克莱因瓶12 小时前
学习使用 Python 机器学习工具 sklearn
人工智能·python·学习·机器学习·ai·agent·智能体
GNG12 小时前
《终身成长》读书笔记
笔记·学习
Omics Pro13 小时前
3种蛋白结构输入方式!已申报欧洲发明专利
数据库·人工智能·python·机器学习·plotly
Omics Pro14 小时前
「自兹以往」动物肠道微生物组
数据库·人工智能·机器学习·语言模型·自然语言处理