第8章：集成学习

why1512023-08-21 8:03

个体与集成

同质：相同的基学习器，实现容易，但是很难保证差异性。
异质：不同的基学习器，实现复杂，不同模型之间本来就存在差异性，但是很难直接比较不同模型的输出，需要复杂的配准方法。

好而不同

boosting

Adaboost

求解h

求解alpha

bagging

随机森林

数据集划分：使用类似自助法的k折交叉验证，有放回的取出，分别训练T个决策树。

随机：一个是训练集的随机，一个是属性的随机（每次在当前属性中随机取K个构成属性子集，在子集中选择信息增益最大的属性）

结合策略

集合的好处

可能多个假设在训练集上达到同等性能，使用单学习器可能因为误选而导致泛化性能不佳。
单个可能陷入局部极小点。
可以使相应的假设空间扩大。

结合方法

平均法

简单平均
加权平均

投票法

绝对多数投票（大于一半则预测为该标记，否则拒绝）
相对多数投票
加权投票法

学习法

利用初始数据集训练出初级学习器，然后生成一个新数据集，训练一个次级学习器。

多样性增强

数据样本扰动
输入属性扰动
输出表示扰动
算法参数扰动

上一篇：视频集中存储/云存储/磁盘阵列EasyCVR平台接入RTSP设备出现离线情况的排查

下一篇：使用cordova 打包的app 如何让视频横屏播放 video

热门推荐

01UV安装并设置国内源 02Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 03【2025.08.06最新版】Android Studio下载、安装及配置记录（自动下载sdk）04KGG转MP3工具|非KGM文件|解密音频 05蜘蛛磁力搜索引擎大全，如何使用蜘蛛磁力查找磁力链接 062025最新国内服务器可用docker源仓库地址大全（2025年8月更新）07NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 08TRAE 规则（Rules）配置指南：个人习惯、团队规范与最佳实践 09阿里开源首个图像生成基础模型——Qwen-Image本地部署教程，超强中文渲染能力刷新SOTA！10TRAE Rules 实践：为项目配置 6A 工作流