第8章:集成学习

个体与集成

  • 同质:相同的基学习器,实现容易,但是很难保证差异性。
  • 异质:不同的基学习器,实现复杂,不同模型之间本来就存在差异性,但是很难直接比较不同模型的输出,需要复杂的配准方法。




好而不同


boosting

Adaboost


求解h







求解alpha


bagging

随机森林

数据集划分:使用类似自助法的k折交叉验证,有放回的取出,分别训练T个决策树。

随机:一个是训练集的随机,一个是属性的随机(每次在当前属性中随机取K个构成属性子集,在子集中选择信息增益最大的属性)

结合策略

集合的好处

  • 可能多个假设在训练集上达到同等性能,使用单学习器可能因为误选而导致泛化性能不佳。
  • 单个可能陷入局部极小点。
  • 可以使相应的假设空间扩大。

结合方法

平均法

  • 简单平均
  • 加权平均

投票法

  • 绝对多数投票(大于一半则预测为该标记,否则拒绝)
  • 相对多数投票
  • 加权投票法

学习法

利用初始数据集训练出初级学习器,然后生成一个新数据集,训练一个次级学习器。

多样性增强

  • 数据样本扰动
  • 输入属性扰动
  • 输出表示扰动
  • 算法参数扰动
相关推荐
子午2 分钟前
【鱼类识别系统】Python+TensorFlow+Django+人工智能+深度学习+卷积神经网络算法+resnet50
人工智能·python·深度学习
财经三剑客5 分钟前
上汽集团1-11月销售410.8万辆 销量已超去年全年
大数据·人工智能
大数据在线5 分钟前
亚马逊云科技:Agentic AI的“iPhone时刻”正在到来
人工智能·亚马逊云科技·ai agent·kiro·agentic ai
CV爱数码12 分钟前
【宝藏数据集】MCOD:多光谱伪装目标检测首个挑战性基准
人工智能·深度学习·目标检测·计算机视觉·目标跟踪·数据集
YJlio13 分钟前
LogonSessions 学习笔记(9.17):会话枚举与凭据审计
人工智能·笔记·学习
明月醉窗台14 分钟前
多相机同步技术详解
人工智能·数码相机·三维重建·双目·多目
通义灵码15 分钟前
Qoder 官方答疑时间 | Qoder CLI 专场
人工智能·cli·qoder·答疑活动
姚家湾28 分钟前
物模型与大语言模型
人工智能
才盛智能科技34 分钟前
欢小娱自助KTV,娱乐本该自由~
大数据·人工智能·物联网·娱乐·自助ktv系统·才盛云自助ktv系统