机器学习——决策树之回归树

概念

解决回归问题的决策树模型你就是回归树

回归树是一种基于决策树的监督学习算法,用于解决回归问题。通过递归地将特征空间划分为多个子区域,并在每个子区域内拟合一个简单的预测值(如均值),实现对连续目标变量的预测。

特点

必须是二叉树

回归树的构建过程

  1. 特征选择与分割

    遍历所有特征和可能的切分点,选择使均方误差(MSE)或平均绝对误差(MAE)最小的特征和切分点。

    分割准则公式:

    \\min_{j, s} \\left\[ \\min_{c_1} \\sum_{x_i \\in R_1(j,s)} (y_i - c_1)\^2 + \\min_{c_2} \\sum_{x_i \\in R_2(j,s)} (y_i - c_2)\^2 \\right\]

    其中 ( R_1, R_2 ) 为分割后的子区域,( c_1, c_2 ) 为子区域内的预测值(通常取均值)。

  2. 递归分割

    对每个子区域重复上述分割过程,直到满足停止条件(如最大深度、最小样本数或误差减少小于阈值)。

  3. 叶子节点预测

    最终叶子节点的预测值为该区域内样本目标变量的均值。

举例:

两个核心问题:1.节点切分的依据是什么?

2.如何能进行预测?

根据这两个问题,我们讲解回归树的计算示例:

1、

1、计算最优切分点

因为只有一个变量,所以切分变量必然是x,可以考虑如下9个切分点:

1.5,2.5,3.5,4.5,5.5,6.5,7.5,8.5,9.5\]。 【原因:实际上考虑两个变量间任意一个位置为切分点均可】 \<1\>切分点1.5的计算 当s=1.5时,将数据分为两个部分: 第一部分:(1,5.56) 第二部分:(2,5.7)、(3,5.91)、(4,6.4)...(10,9.05) ### 2、计算损失 ![](https://i-blog.csdnimg.cn/direct/4f12c642463e4cf293dbb96d3ae3b012.png) C1=5.56 C2=1/9(5.7+5.91+6.4+6.8+7.05+8.9+8.7+9+9.05)=7.5 Loss = (5.56-5.56)\^2 + (5.7-7.5)\^2+(5.91-7.5)\^2+...+(9.05-7.5)\^2 =0+15.72 =15.72 ### 3、同理计算其他分割点的损失 ![](https://i-blog.csdnimg.cn/direct/1b97d0e9c7f24064a297eee3f46bcff4.png) 容易看出,当s=6.5时,loss=1.93最小,所以第一个划分点s=6.5。 ### 4、对于小于6.5部分 ![](https://i-blog.csdnimg.cn/direct/db27d0a50ae0452bb80e968631220419.png) \<1\>切分点1.5的计算 当s=1.5时,将数据分为两个部分: 第一部分:(1,5.56) 第二部分:(2,5.7)、(3,5.91)、(4,6.4)、(5,6.8)、(6,7.05) Loss = 0 +(5.7-6.37)\^2+(5.91-6.37)\^2 +...+(7.05-6.37)\^2 =0+1.3087=1.3087 C1=5.56 C2=1/5(5.7+5.91+6.4+6.8+7.05)=6.37 ### 5、可得出 ![](https://i-blog.csdnimg.cn/direct/1fc5446ea65c43fcb2b2d45e22ff10e4.png) 容易看出:\<1\>当s=3.5时,loss=0.2771最小,所以第一个划分点s=3.5。 \<2\>当s=8.5时,loss=0.021最小,所以第二个划分点s=8.5。 ### 6、假设只分裂我们计算的这几次 ![](https://i-blog.csdnimg.cn/direct/365049c345d842908ee127bdf190371e.png) 那么分段函数为: \<1\>当x\<=3.5时,1/3(5.56+5.7+5.91)=5.72 \<2\>当3.5\当6.5\当8.5\当x\<=3.5时,1/3(5.56+5.7+5.91)=5.72 \<2\>当3.5\当6.5\当8.5\

相关推荐
gaozhiyong081312 小时前
提示词的解剖学:Gemini 3.1 Pro 提示工程高级策略与国内实战
人工智能·算法·机器学习
小刘的AI小站12 小时前
L9 Policy Gradient Method (二)
算法·机器学习·强化学习
程序员Shawn13 小时前
【机器学习 | 第六篇】- 机器学习
人工智能·算法·机器学习·集成学习
陈天伟教授14 小时前
人工智能应用- AI 增强显微镜:08.实时辅助诊断
人工智能·神经网络·机器学习·推荐算法
研知有术一站式科研平台15 小时前
研知有术论文辅导丨文献综述的三种类型和写法(附直接能用的写作模板)
人工智能·经验分享·机器学习·数据挖掘·论文笔记
高洁0115 小时前
【无标题】如何利用知识图谱实现推理和计算
人工智能·机器学习·数据挖掘·transformer·知识图谱
梦想很大很大15 小时前
一个推荐系统是如何“长大”的(工程演进)
人工智能·机器学习·架构
FluxMelodySun16 小时前
机器学习(二十七) 降维:度量学习与随机梯度下降法求解
人工智能·学习·机器学习
AI-Ming18 小时前
程序员转行学习 AI 大模型: 模型微调| 附清晰概念分类
人工智能·pytorch·深度学习·机器学习·chatgpt·nlp·gpt-3
禁默19 小时前
从零吃透大语言模型 LLM,AI 应用开发必懂底层逻辑
人工智能·机器学习·语言模型·大模型