机器学习知识点总结:什么是GBDT(梯度提升树)

什么是GBDT(梯度提升树)

虽然GBDT同样由许多决策树组成,但它与随机森林由许多不同。

其中之一是GBDT中的树都是回归树,树有分类有回归,区分它们的方法很简单。将苹果单纯分为好与坏的是分类树,如果能为苹果的好坏程度打个分,那它就是回归树。

另一个不同的是GBDT中的每棵树都建立在前一棵树的基础上。

以苹果打分为例,我们会先训练一棵树大体预测一下苹果们的分数,再去训练一棵树去预测它们与真实分数间的差距,如果两者相加仍与真实分数存在差距,我们再训练第三棵树预测这部分差距,重复这个过程不断减少误差,将这些树的预测值加起来,就是苹果的分数。

除了苹果,被评分的还可以是网页、电影、商品。通过预测关联程度、点击率或是用户的喜好程度来排序,GBDT在搜索、广告、推荐系统等领域有着广泛应用,能处理标签、数值等各类数据,解释性强,这些都是GBDT的优点。

不过由于树与树之间的相互依赖,需要较长的训练时间。运用多个模型共同解决问题,GBDT自然属于集成学习。

像这种一个模型依赖于上一个模型,共同逼近正确答案的方法被称为Boosting提升,也就是GBDT中的B。

与随机森林类似,模型间相互独立共同投票出结果的方法,则被称为Bagging(装袋)。

还有一种Stacking(堆叠),是在一多个模型的基础上放置一个更高层的模型。将底层模型的输出作为它的输入,由它给出最终的预测结果。

相关推荐
core512几秒前
赋予AI真正的“长期记忆”:开源大模型记忆操作系统 MemOS 深度解析与实战
人工智能·开源·大模型·记忆·长期记忆·memos
源码之家4 分钟前
计算机毕业设计:Python二手车交易价格预测分析平台 Django框架 随机森林 可视化 数据分析 汽车 车辆 大数据 hadoop(建议收藏)✅
大数据·爬虫·python·机器学习·django·汽车·课程设计
guoji77884 分钟前
ChatGPT 5.4官网技术内核与行业赋能:2026年国内镜像站实测与高阶应用拆解
人工智能
码农的神经元4 分钟前
Deep-HMM 融合 Transformer:序列分类的动态隐状态建模新范式
人工智能·深度学习·transformer
發糞塗牆7 分钟前
【Azure 架构师学习笔记 】- Azure AI(22) -AI知识库Agent平台(1)- 项目启动及基础搭建
人工智能·ai·azure
FL16238631297 分钟前
智慧工业X射线图像煤矸石检测数据集VOC+YOLO格式447张3类别
深度学习·yolo·机器学习
OPHKVPS8 分钟前
网络安全新威胁:开源AI平台CyberStrikeAI显著降低攻击门槛
大数据·网络·人工智能·安全
jiajia_lisa10 分钟前
解锁数字化转型密钥,OCR赋能多行业降本增效
人工智能
维度攻城狮14 分钟前
Docker 部署 Dify,快速私有化搭建专属知识库问答
人工智能·docker·部署·dify·知识问答
Fzuim16 分钟前
写给 AI 的散文:意图式提示词写作指南
人工智能·ai·prompt·提示词