【Python】【机器学习】集成算法(随机森林、提升算法)

bagging类似集成电路的并联,取平均;boosting类似串联,加强。

Bagging



神经网络是黑盒,判断逻辑不可解释

feature importance的原理:

计算特征组ABCD和AB'CD的结果,(B'是B数据的破坏或随机打乱或随机加入噪音点干扰值),在使用相同模型下:

AB'CD的结果如果与ABCD结果差不多,则B特征不重要;

如果err(AB'CD)>>err(ABCD),则B特征重要。

Boosting

AdaBoot算法会把上一次预测错的数据的权重增大。

Xgboost一步步处理二八原则的二。如100数据样本,第一棵树预测的error有20,第二棵树的样本是从这20中进一步预测,而非从100预测。以此类推。最终的预测结果是树1+树2+...+树N。效率低但效果好。

Stacking

相关推荐
zxhl0927几秒前
大模型微调技术 LoRA、QLoRA、QA-LoRA 原理
人工智能·深度学习·机器学习
重生之我是Java开发战士19 分钟前
【动态规划】简单多状态dp问题:按摩师,打家劫舍,删除并获得点数,粉刷房子,买卖股票的最佳时机
算法·动态规划·哈希算法
2301_7644413333 分钟前
OpenClaw框架的多Agent协作系统
人工智能·机器学习·语言模型·自然语言处理·ai编程
老刘说AI1 小时前
浅谈多模态领域的Transformer
人工智能·深度学习·神经网络·机器学习·语言模型·transformer
KAU的云实验台1 小时前
单/多UAV、静/动态路径规划,基于PlatEMO平台的带约束多目标优化 本文核心内容:
算法·matlab·无人机
Liangwei Lin1 小时前
洛谷 P1807 最长路
数据结构·算法
会编程的土豆1 小时前
【数据结构与算法】二叉树从建立开始
数据结构·c++·算法
_日拱一卒1 小时前
LeetCode:最大子数组和
数据结构·算法·leetcode
泰恒1 小时前
学习神经网络
人工智能·深度学习·机器学习
计算机安禾2 小时前
【数据结构与算法】第22篇:线索二叉树(Threaded Binary Tree)
c语言·开发语言·数据结构·学习·算法·链表·visual studio code