Day22_【机器学习—集成学习(4)—Boosting—GBDT算法】

提升树 (Boosting Decision Tree )

每一个弱学习器通过拟合残差来构建强学习器

梯度提升树 (Gradient Boosting Decision Tree)

每一个弱学习器通过拟合负梯度来构建强学习器

一、提升树

残差

数学公式为:

残差=真实值−预测值

其中:

  • ri:第 i 个样本的残差
  • yi:第 i 个样本的真实值(观测值)
  • y^i:模型对第 i 个样本的预测值

二、GBDT

GBDT(梯度提升树)不再拟合残差,而是利用梯度下降的近似方法,利用损失函数的负梯度作为提升树算法中的残差近似值。

负梯度

负梯度=残差=真实值-预测值

流程

1 初始化弱学习器(目标值的均值作为预测值)

2 迭代构建学习器,每一个学习器拟合上一个学习器的负梯度

3 直到达到指定的学习器个数

4 当输入未知样本时,将所有弱学习器的输出结果组合起来作为强学习器的输出

详细过程

相关推荐
CLubiy2 小时前
【研究生随笔】Pytorch中的线性代数
pytorch·python·深度学习·线性代数·机器学习
孤狼灬笑3 小时前
机器学习十大经典算法解析与对比
人工智能·算法·机器学习
星际棋手3 小时前
【AI】一文说清楚神经网络、机器学习、专家系统
人工智能·神经网络·机器学习
教练、我想打篮球4 小时前
13 pyflink/scala 进行 csv 文件的批处理
人工智能·机器学习
武子康5 小时前
AI-调查研究-106-具身智能 机器人学习数据采集工具和手段:传感器、API、遥操作、仿真与真人示教全流程
人工智能·深度学习·机器学习·ai·系统架构·机器人·具身智能
武子康6 小时前
AI-调查研究-107-具身智能 强化学习与机器人训练数据格式解析:从状态-动作对到多模态轨迹标准
人工智能·深度学习·机器学习·ai·系统架构·机器人·具身智能
大千AI助手7 小时前
加权分位数直方图:提升机器学习效能的关键技术
人工智能·机器学习·xgboost·直方图·加权直方图·特征分裂
AI数据皮皮侠7 小时前
中国博物馆数据
大数据·人工智能·python·深度学习·机器学习
强哥之神7 小时前
从零理解 KV Cache:大语言模型推理加速的核心机制
人工智能·深度学习·机器学习·语言模型·llm·kvcache
Q26433650239 小时前
【有源码】基于Python与Spark的火锅店数据可视化分析系统-基于机器学习的火锅店综合竞争力评估与可视化分析-基于用户画像聚类的火锅店市场细分与可视化研究
大数据·hadoop·python·机器学习·数据分析·spark·毕业设计