机器学习Day9:集成学习

概念

集成学习通过构建并结合多个学习器来完成学习任务

模型

集成学习的结果通过投票法(少数服从多数)产生,所以学习器要有多样性,精度高不一定是好事

1.Bagging模型并行 训练多个学习器

典型代表:随机森林

随机:数据采样随机,特征选择随机

森林:多个决策树并行放在一起

优点:能够学习高维数据,不用做特征选择;可以进行可视化 展示,便于分析;训练完成后,能给出哪些特征 更重要

理论上,树的数量越多训练效果越好,但当树的数量达到一个值时,增加树的数量作用不大

2.Boosting模型 :先训练出一个基学习器,在此基础上进行调整提升训练效果,以此类推,直至学习器的数量达到预设的值,最终将这些学习器进行加权结合

典型代表:AdaBoost 、xgBoost

AdaBoost会根据前一次的分类效果调整数据权重

3.Stacking堆叠模型 :第一阶段得出各自结果,第二阶段再用前一阶段的结果训练

适合竞赛使用

相关推荐
财经资讯数据_灵砚智能13 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年4月24日
人工智能·python·信息可视化·自然语言处理·ai编程
m0_7092143413 小时前
20260424 | EndNote报错 {人名, 年份 #数字}的解决方法
人工智能
newdf观察者13 小时前
以线性代数的行列式理解数学应用备忘
人工智能·线性代数·机器学习
这是程序猿13 小时前
mysql的安装教程
java·人工智能·windows·mysql
ting945200013 小时前
Text-To-Video-Synthesis 全维度深度解析
人工智能
DeepSCRM13 小时前
跨境SOP:从环境隔离到实时翻译,打造巴西市场24/7自动转化漏斗
大数据·人工智能
传说故事13 小时前
【论文阅读】DARWIN GÖDEL MACHINE: 自我改进智能体的开放式进化
论文阅读·人工智能·agent
财经资讯数据_灵砚智能13 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年4月23日
人工智能·python·信息可视化·自然语言处理·ai编程
AI-小柒13 小时前
磅上线!DataEyes 聚合平台正式接入 GPT-Image-2,开启多模态 AI 生成全新纪元
大数据·开发语言·数据库·人工智能·gpt·php
思绪无限13 小时前
YOLOv5至YOLOv12升级:机械器件识别系统的设计与实现(完整代码+界面+数据集项目)
人工智能·python·深度学习·目标检测·计算机视觉·机械器件识别