吴恩达机器学习笔记 二十七 决策树中连续值特征的选择 回归树

还是猫狗分类的案例,假如再增加一个特征weight,该值是一个连续的值,如何在决策树中使用该特征?

如下图所示,尝试不同的阈值 ,如 weight<=9 , 此时左边有四个样本,都为猫,右边有六个样本,其中一个为猫,计算信息增益(绿色的那个)。同理,把条件设为weight<=8,划分后左边有两个样本,全是猫,右边有八个样本,其中三个是猫,计算信息增益(蓝色的那个),可以发现边界设为9时信息增益最大,所以就按照这个标准分。

决策树用于分类问题-->推广到回归问题:回归树

用决策树来预测一个数字而不是类别

用于回归问题时,我们不追求减少熵,而是期望能够降低分类后每个子集 weight 的方差 。如下图,计算不同分类后的左右两支子树的带权重方差和,再用根节点的方差减去这个数,得到方差的减少量,方差减少的越多越好,所以选择 ear shape 作为分割特征。

相关推荐
QT 小鲜肉8 分钟前
【Linux命令大全】001.文件管理之chattr命令(实操篇)
linux·运维·服务器·笔记
听风吹等浪起9 分钟前
机器学习算法:随机梯度下降算法
人工智能·深度学习·算法·机器学习
Yuner200010 分钟前
Python机器学习:从零基础到深度实战
人工智能·python·机器学习
落羽的落羽11 分钟前
【C++】哈希扩展——位图和布隆过滤器的介绍与实现
linux·服务器·开发语言·c++·人工智能·算法·机器学习
音视频牛哥21 分钟前
SmartMediakit技术白皮书:与主流云厂商(PaaS)的技术定位对比与选型指南
人工智能·深度学习·机器学习·音视频·gb28181对接·rtsp服务器·rtsp播放器rtmp播放器
高洁011 小时前
一文了解图神经网络
人工智能·python·深度学习·机器学习·transformer
极客BIM工作室1 小时前
大模型参数高效微调:5种主流方法的技术解析
人工智能·机器学习
海边夕阳20061 小时前
【每天一个AI小知识】:什么是扩散模型?
人工智能·经验分享·深度学习·机器学习·扩散模型
阿蒙Amon1 小时前
JavaScript学习笔记:14.类型数组
javascript·笔记·学习
点我头像干啥1 小时前
机器学习算法之动量法:优化梯度下降的“惯性”策略
人工智能·神经网络·算法·机器学习