【Python】【机器学习】集成算法(随机森林、提升算法)

bagging类似集成电路的并联,取平均;boosting类似串联,加强。

Bagging



神经网络是黑盒,判断逻辑不可解释

feature importance的原理:

计算特征组ABCD和AB'CD的结果,(B'是B数据的破坏或随机打乱或随机加入噪音点干扰值),在使用相同模型下:

AB'CD的结果如果与ABCD结果差不多,则B特征不重要;

如果err(AB'CD)>>err(ABCD),则B特征重要。

Boosting

AdaBoot算法会把上一次预测错的数据的权重增大。

Xgboost一步步处理二八原则的二。如100数据样本,第一棵树预测的error有20,第二棵树的样本是从这20中进一步预测,而非从100预测。以此类推。最终的预测结果是树1+树2+...+树N。效率低但效果好。

Stacking

相关推荐
小小测试开发4 小时前
安装 Python 3.10+
开发语言·人工智能·python
KaMeidebaby4 小时前
卡梅德生物技术快报|PD1 单克隆抗体定制配套 N 糖全谱质控开发
前端·人工智能·算法·数据挖掘·数据分析
梦想不只是梦与想4 小时前
Python 中的装饰器
python·装饰器
我叫唧唧波5 小时前
Python+AI 全栈学习笔记
人工智能·python·学习
8Qi85 小时前
LeetCode 235. 二叉搜索树的最近公共祖先(LCA)
算法·leetcode·二叉树·递归·二叉搜索树·lca·迭代
bIo7lyA8v5 小时前
算法稳定性分析中的随机扰动建模的技术8
算法
copyer_xyf5 小时前
Python 异常处理
前端·后端·python
科研online6 小时前
基于多源数据和XGBoost-SHAP分析中国大陆绿地碳汇空间变异影响因素的非线性相关性与尺度差异
算法·学习方法
麻雀飞吧6 小时前
期货多合约策略目标持仓怎么更新才不乱
python·区块链
Cthy_hy6 小时前
拓扑排序超详解:原理 + Kahn 贪心算法
python·算法·贪心算法