机器学习Day9:集成学习

概念

集成学习通过构建并结合多个学习器来完成学习任务

模型

集成学习的结果通过投票法(少数服从多数)产生,所以学习器要有多样性,精度高不一定是好事

1.Bagging模型并行 训练多个学习器

典型代表:随机森林

随机:数据采样随机,特征选择随机

森林:多个决策树并行放在一起

优点:能够学习高维数据,不用做特征选择;可以进行可视化 展示,便于分析;训练完成后,能给出哪些特征 更重要

理论上,树的数量越多训练效果越好,但当树的数量达到一个值时,增加树的数量作用不大

2.Boosting模型 :先训练出一个基学习器,在此基础上进行调整提升训练效果,以此类推,直至学习器的数量达到预设的值,最终将这些学习器进行加权结合

典型代表:AdaBoost 、xgBoost

AdaBoost会根据前一次的分类效果调整数据权重

3.Stacking堆叠模型 :第一阶段得出各自结果,第二阶段再用前一阶段的结果训练

适合竞赛使用

相关推荐
让我上个超影吧1 分钟前
从Prompt工程到Harness工程:AI Agent落地的下一代软件工程范式
大数据·人工智能
jinanwuhuaguo8 分钟前
OpenClaw联邦之心——从孤岛记忆到硅基集体潜意识的拓扑学革命(第二十三篇)
android·人工智能·kotlin·拓扑学·openclaw
科技云报道12 分钟前
安全进入“AI自主攻击”时代,瑞数信息如何用AI对抗AI
人工智能·安全
硅谷秋水13 分钟前
ClawVM:有状态工具LLM智体的Harness管理型虚拟内存
人工智能·深度学习·语言模型
Joseph Cooper16 分钟前
AI Agent 落地入门:从模型、工具到 Skills 与 MCP 的分工
人工智能·ai·agent·claude·skill·mcp
爱学习的张大18 分钟前
具身智能论文精读(五):OpenVLA
人工智能·算法
AI创界者19 分钟前
OmniVoice 语音大模型一键部署:支持批量任务、智能 SRT 配音与多人对话全攻略》
人工智能
丷丩22 分钟前
为什么Geo-UP是一款可以直接用于交付的智能应用
人工智能·gis·空间分析·geoai
xiangzhihong827 分钟前
Claude Code系列教程之Claude Code钩子
人工智能
sheji10529 分钟前
泳池机器人行业市场分析报告
人工智能·机器人·智能硬件