机器学习——决策树之回归树

概念

解决回归问题的决策树模型你就是回归树

回归树是一种基于决策树的监督学习算法,用于解决回归问题。通过递归地将特征空间划分为多个子区域,并在每个子区域内拟合一个简单的预测值(如均值),实现对连续目标变量的预测。

特点

必须是二叉树

回归树的构建过程

  1. 特征选择与分割

    遍历所有特征和可能的切分点,选择使均方误差(MSE)或平均绝对误差(MAE)最小的特征和切分点。

    分割准则公式:

    \\min_{j, s} \\left\[ \\min_{c_1} \\sum_{x_i \\in R_1(j,s)} (y_i - c_1)\^2 + \\min_{c_2} \\sum_{x_i \\in R_2(j,s)} (y_i - c_2)\^2 \\right\]

    其中 ( R_1, R_2 ) 为分割后的子区域,( c_1, c_2 ) 为子区域内的预测值(通常取均值)。

  2. 递归分割

    对每个子区域重复上述分割过程,直到满足停止条件(如最大深度、最小样本数或误差减少小于阈值)。

  3. 叶子节点预测

    最终叶子节点的预测值为该区域内样本目标变量的均值。

举例:

两个核心问题:1.节点切分的依据是什么?

2.如何能进行预测?

根据这两个问题,我们讲解回归树的计算示例:

1、

1、计算最优切分点

因为只有一个变量,所以切分变量必然是x,可以考虑如下9个切分点:

1.5,2.5,3.5,4.5,5.5,6.5,7.5,8.5,9.5\]。 【原因:实际上考虑两个变量间任意一个位置为切分点均可】 \<1\>切分点1.5的计算 当s=1.5时,将数据分为两个部分: 第一部分:(1,5.56) 第二部分:(2,5.7)、(3,5.91)、(4,6.4)...(10,9.05) ### 2、计算损失 ![](https://i-blog.csdnimg.cn/direct/4f12c642463e4cf293dbb96d3ae3b012.png) C1=5.56 C2=1/9(5.7+5.91+6.4+6.8+7.05+8.9+8.7+9+9.05)=7.5 Loss = (5.56-5.56)\^2 + (5.7-7.5)\^2+(5.91-7.5)\^2+...+(9.05-7.5)\^2 =0+15.72 =15.72 ### 3、同理计算其他分割点的损失 ![](https://i-blog.csdnimg.cn/direct/1b97d0e9c7f24064a297eee3f46bcff4.png) 容易看出,当s=6.5时,loss=1.93最小,所以第一个划分点s=6.5。 ### 4、对于小于6.5部分 ![](https://i-blog.csdnimg.cn/direct/db27d0a50ae0452bb80e968631220419.png) \<1\>切分点1.5的计算 当s=1.5时,将数据分为两个部分: 第一部分:(1,5.56) 第二部分:(2,5.7)、(3,5.91)、(4,6.4)、(5,6.8)、(6,7.05) Loss = 0 +(5.7-6.37)\^2+(5.91-6.37)\^2 +...+(7.05-6.37)\^2 =0+1.3087=1.3087 C1=5.56 C2=1/5(5.7+5.91+6.4+6.8+7.05)=6.37 ### 5、可得出 ![](https://i-blog.csdnimg.cn/direct/1fc5446ea65c43fcb2b2d45e22ff10e4.png) 容易看出:\<1\>当s=3.5时,loss=0.2771最小,所以第一个划分点s=3.5。 \<2\>当s=8.5时,loss=0.021最小,所以第二个划分点s=8.5。 ### 6、假设只分裂我们计算的这几次 ![](https://i-blog.csdnimg.cn/direct/365049c345d842908ee127bdf190371e.png) 那么分段函数为: \<1\>当x\<=3.5时,1/3(5.56+5.7+5.91)=5.72 \<2\>当3.5\当6.5\当8.5\当x\<=3.5时,1/3(5.56+5.7+5.91)=5.72 \<2\>当3.5\当6.5\当8.5\

相关推荐
小二·2 小时前
AI工程化实战《二》:RAG 高级优化全解——从 HyDE 到 Self-RAG,打造高精度企业问答系统
人工智能·microsoft·机器学习
yuhaiqun19892 小时前
学AI Agent:从React模式到Plan框架,3条路径一次学透
人工智能·经验分享·笔记·react.js·机器学习·ai·aigc
大模型教程.3 小时前
收藏级教程:ReAct模式详解,让大模型从回答问题到解决问题
前端·人工智能·机器学习·前端框架·大模型·产品经理·react
海边夕阳20063 小时前
【每天一个AI小知识】:什么是多模态学习?
人工智能·深度学习·机器学习·计算机视觉·语言模型·自然语言处理
free-elcmacom3 小时前
机器学习高阶教程<8>分布式训练三大核心策略拆解
人工智能·分布式·python·机器学习
有为少年4 小时前
带噪学习 | Ambient Diffusion (NeurIPS 2023)下篇
人工智能·深度学习·神经网络·学习·机器学习·计算机视觉
JoannaJuanCV4 小时前
自动驾驶—CARLA仿真(21)manual_control_carsim demo
人工智能·机器学习·自动驾驶
papaofdoudou4 小时前
基于QEMU 模拟intel-iommu的sva/svm demo环境搭建和验证
算法·机器学习·支持向量机
再__努力1点4 小时前
【78】HOG+SVM行人检测实践指南:从算法原理到python实现
开发语言·人工智能·python·算法·机器学习·支持向量机·计算机视觉