吴恩达机器学习笔记 二十六 决策树学习过程 独热编码one-hot

决策树的学习过程

  1. 所有样本都在根结点

2.计算所有可能的特征的信息增益,选择信息增益最大的那个

3.根据选择的特征分离数据集,创造左右两支子树

4.继续进行分裂直到达到停止标准。停止标准有:一个节点只有一类样本;分裂一个节点会导致树的深度超过最大值;从新的分裂得到的信息增益低于一个阈值;一个节点中的样本数低于一个阈值。

决策树可以看做一个**递归(recursive)**的过程

独热编码one-hot

例如猫狗分类,原本耳朵形状这个特征有三个可能的取值,采用独热编码的方式创建三个新的特征,每个特征只有两种情况(0或1) ,每个特征恰好有一个是1,所以叫独热。也可以推广到其他特征,用0或1来表示特征,可以将数字作为神经网络的输入。

相关推荐
灰灰勇闯IT10 分钟前
隐语MOOC三期笔记:可信数据空间实战课——从“数据孤岛”到“安全流通”,企业落地的3个关键步骤(附部署脚本)
笔记·安全
Aspect of twilight1 小时前
KNN分类器与K-means无监督聚类详解
人工智能·机器学习·kmeans·knn
*星星之火*1 小时前
【大白话 AI 答疑】第5篇 从 “窄域专精” 到 “广谱通用”:传统机器学习与大模型的 6 大核心区别
人工智能·机器学习
roman_日积跬步-终至千里1 小时前
【模式识别与机器学习(7)】主要算法与技术(下篇:高级模型与集成方法)之 扩展线性模型(Extending Linear Models)
人工智能·算法·机器学习
jyan_敬言1 小时前
【Docker】Kubernetes部署容器化应用程序
c++·笔记·其他·docker·容器·kubernetes·学习方法
sheeta19982 小时前
LeetCode 每日一题笔记 日期:2025.11.30 题目:1590.使数组和能被 P 整除
笔记·算法·leetcode
@游子2 小时前
内网渗透笔记-Day9
笔记
弘毅 失败的 mian2 小时前
Git 基本操作
大数据·经验分享·笔记·git·elasticsearch
老欧学视觉2 小时前
0010集成学习(Ensemble Learning)
人工智能·机器学习·集成学习