机器学习知识点总结:什么是GBDT(梯度提升树)

什么是GBDT(梯度提升树)

虽然GBDT同样由许多决策树组成,但它与随机森林由许多不同。

其中之一是GBDT中的树都是回归树,树有分类有回归,区分它们的方法很简单。将苹果单纯分为好与坏的是分类树,如果能为苹果的好坏程度打个分,那它就是回归树。

另一个不同的是GBDT中的每棵树都建立在前一棵树的基础上。

以苹果打分为例,我们会先训练一棵树大体预测一下苹果们的分数,再去训练一棵树去预测它们与真实分数间的差距,如果两者相加仍与真实分数存在差距,我们再训练第三棵树预测这部分差距,重复这个过程不断减少误差,将这些树的预测值加起来,就是苹果的分数。

除了苹果,被评分的还可以是网页、电影、商品。通过预测关联程度、点击率或是用户的喜好程度来排序,GBDT在搜索、广告、推荐系统等领域有着广泛应用,能处理标签、数值等各类数据,解释性强,这些都是GBDT的优点。

不过由于树与树之间的相互依赖,需要较长的训练时间。运用多个模型共同解决问题,GBDT自然属于集成学习。

像这种一个模型依赖于上一个模型,共同逼近正确答案的方法被称为Boosting提升,也就是GBDT中的B。

与随机森林类似,模型间相互独立共同投票出结果的方法,则被称为Bagging(装袋)。

还有一种Stacking(堆叠),是在一多个模型的基础上放置一个更高层的模型。将底层模型的输出作为它的输入,由它给出最终的预测结果。

相关推荐
正脉科工 CAE仿真35 分钟前
抗震计算 | 基于随机振动理论的结构地震响应计算
人工智能
看到我,请让我去学习37 分钟前
OpenCV编程- (图像基础处理:噪声、滤波、直方图与边缘检测)
c语言·c++·人工智能·opencv·计算机视觉
码字的字节39 分钟前
深度解析Computer-Using Agent:AI如何像人类一样操作计算机
人工智能·computer-using·ai操作计算机·cua
说私域2 小时前
互联网生态下赢家群体的崛起与“开源AI智能名片链动2+1模式S2B2C商城小程序“的赋能效应
人工智能·小程序·开源
董厂长5 小时前
langchain :记忆组件混淆概念澄清 & 创建Conversational ReAct后显示指定 记忆组件
人工智能·深度学习·langchain·llm
G皮T8 小时前
【人工智能】ChatGPT、DeepSeek-R1、DeepSeek-V3 辨析
人工智能·chatgpt·llm·大语言模型·deepseek·deepseek-v3·deepseek-r1
九年义务漏网鲨鱼9 小时前
【大模型学习 | MINIGPT-4原理】
人工智能·深度学习·学习·语言模型·多模态
元宇宙时间9 小时前
Playfun即将开启大型Web3线上活动,打造沉浸式GameFi体验生态
人工智能·去中心化·区块链
开发者工具分享9 小时前
文本音频违规识别工具排行榜(12选)
人工智能·音视频
产品经理独孤虾9 小时前
人工智能大模型如何助力电商产品经理打造高效的商品工业属性画像
人工智能·机器学习·ai·大模型·产品经理·商品画像·商品工业属性