Day22_【机器学习—集成学习(4)—Boosting—GBDT算法】

提升树 (Boosting Decision Tree )

每一个弱学习器通过拟合残差来构建强学习器

梯度提升树 (Gradient Boosting Decision Tree)

每一个弱学习器通过拟合负梯度来构建强学习器

一、提升树

残差

数学公式为:

残差=真实值−预测值

其中:

  • ri:第 i 个样本的残差
  • yi:第 i 个样本的真实值(观测值)
  • y^i:模型对第 i 个样本的预测值

二、GBDT

GBDT(梯度提升树)不再拟合残差,而是利用梯度下降的近似方法,利用损失函数的负梯度作为提升树算法中的残差近似值。

负梯度

负梯度=残差=真实值-预测值

流程

1 初始化弱学习器(目标值的均值作为预测值)

2 迭代构建学习器,每一个学习器拟合上一个学习器的负梯度

3 直到达到指定的学习器个数

4 当输入未知样本时,将所有弱学习器的输出结果组合起来作为强学习器的输出

详细过程

相关推荐
风暴之零5 小时前
卡尔曼滤波学习
人工智能·学习·机器学习
sensen_kiss6 小时前
INT305 Machine Learning 机器学习 Pt.6 卷积神经网络(Convolutional Neural Network)
机器学习·计算机视觉·cnn
长桥夜波7 小时前
【第二十一周】机器学习周报
人工智能·机器学习
平和男人杨争争8 小时前
SNN(TTFS)论文阅读——LC-TTFS
论文阅读·人工智能·神经网络·机器学习
算家计算11 小时前
AI也能像人一样拥有长时记忆了!谷歌最新研究攻克AI核心难题
人工智能·机器学习·资讯
thorn_r13 小时前
MCP驱动的AI角色扮演游戏
人工智能·游戏·机器学习·ai·自然语言处理·agent·mcp
青云交13 小时前
Java 大视界 -- Java 大数据机器学习模型在电商用户流失预测与留存策略制定中的应用
随机森林·机器学习·特征工程·java 大数据·spark mllib·电商用户流失·留存策略
phoenix@Capricornus15 小时前
多项分布 (Multinomial Distribution)
线性代数·机器学习·概率论
不当菜鸡的程序媛15 小时前
Flow Matching|什么是“预测速度场 vt=ε−x”?
人工智能·算法·机器学习