什么是集成学习

什么是集成学习

  • 集成学习是一种分布式机器学习框架,通过构建多个学习器并将其结合起来完成学习任务。由于在实际应用中单一的学习器往往不能达到理想的学习效果,且有时单一学习器会导致过拟合,因此使用多个学习器进行集成学习往往能够达到更好的学习效果。

  • 根据学习器训练的模型是否为同类模型,集成学习分为同质集成学习和异质集成学习两类。

    1. 若训练的多个模型是同一类型的模型,则为同质集成学习,所用算法称为"基学习算法",每一个模型称为"基学习器"。
    2. 若训练的多个模型非同一类型的模型,则为异质集成学习,每一个模型称为"组件学习器"或"个体学习器"。
  • 根据模型训练和结合策略的不同,集成学习可分为串行方法(Boosting)、并行方法(Bagging)和堆叠方法(Stacking)三类。

  • 根据任务类型是分类还是回归,集成学习的融合方式可以分为投票(voting),平均(averaging)

  • sklearn中的集成算法模块ensemble

    类的功能
    ensemble.AdaBoostClassifier AdaBoost分类
    ensemble.AdaBoostRegressor AdaBoost回归
    ensemble.BaggingClassifier 袋装分类器
    ensemble.BaggingRegressor 袋装回归器
    ensemble.ExtraTreesClassifier Extra-trees分类(超树,极端随机树)
    ensemble.ExtraTreesRegressor Extra-trees回归
    ensemble.GradientBoostingClassifier 梯度提升分类
    ensemble.GradientBoostingRegressor 梯度提升回归
    ensemble.IsolationForest 孤立森林
    ensemble.RandomForestClassifier 随机森林分类
    ensemble.RandomForestRegressor 随机森林回归
    ensemble.RandomTreesEmbedding 完全随机树的集成
    ensemble.VotingClassifier 用于不合适估算器的软投票/多数规则分类器

    集成算法中,有一半以上都是树的集成模型,可以想见决策树在集成中必定是有很好的效果。


相关推荐
HXDGCL9 小时前
大会观察 | 破除创新链堵点:论“工厂直供”模式如何加速自动化核心部件迭代
大数据·人工智能·自动化·自动化生产线·环形导轨
梵得儿SHI9 小时前
(第八篇)Spring AI 核心技术攻坚:模型评估与调优 - 提升 AI 响应质量的双轮驱动实践
人工智能
果粒蹬i9 小时前
生成式 AI 质量控制:幻觉抑制与 RLHF 对齐技术详解
前端·人工智能·easyui
数据与后端架构提升之路9 小时前
实战:手搓一个“BEV 级”自动驾驶训练加速平台 —— 当 RTX 4090 遇上多模态数据
人工智能·机器学习·自动驾驶
互联网科技看点9 小时前
国产 CAD主机厂快速响应应用方案
人工智能
五度易链-区域产业数字化管理平台9 小时前
五度易链企业数据服务架构思考:从“存数据”到“用数据”的全周期解决方案
大数据·人工智能·架构
HyperAI超神经9 小时前
【vLLM 学习】Rlhf Utils
人工智能·深度学习·学习·机器学习·ai编程·vllm
OpenCSG9 小时前
提示词工程到AgenticOps:OpenCSG公益课
大数据·人工智能·开源·opencsg
悟纤9 小时前
Suno AI 音乐节奏设计完全指南 | Suno高级篇 | 第23篇
人工智能·suno·suno ai·suno api·ai music
EasyGBS10 小时前
EasyGBS的金融网点全场景智能可视化监管方案设计
大数据·人工智能