【Python】【机器学习】集成算法(随机森林、提升算法)

bagging类似集成电路的并联,取平均;boosting类似串联,加强。

Bagging



神经网络是黑盒,判断逻辑不可解释

feature importance的原理:

计算特征组ABCD和AB'CD的结果,(B'是B数据的破坏或随机打乱或随机加入噪音点干扰值),在使用相同模型下:

AB'CD的结果如果与ABCD结果差不多,则B特征不重要;

如果err(AB'CD)>>err(ABCD),则B特征重要。

Boosting

AdaBoot算法会把上一次预测错的数据的权重增大。

Xgboost一步步处理二八原则的二。如100数据样本,第一棵树预测的error有20,第二棵树的样本是从这20中进一步预测,而非从100预测。以此类推。最终的预测结果是树1+树2+...+树N。效率低但效果好。

Stacking

相关推荐
辰尘_星启6 小时前
【Linux】Python Socket编程指南
linux·python·socket·系统·通信
谙弆悕博士6 小时前
快速学C语言——第19章:C语言常用开发库
c语言·开发语言·算法·业界资讯·常用函数
光影少年6 小时前
前端算法题
前端·javascript·算法
南宫萧幕6 小时前
基于 Simulink 与 Python 联合仿真的 eVTOL 强化学习全链路实战
开发语言·人工智能·python·算法·机器学习·控制
电魂泡哥6 小时前
CMS垃圾回收
java·jvm·算法
哥布林学者6 小时前
深度学习进阶(二十二)T5:NLP任务的首次大一统
机器学习·ai
Amctwd6 小时前
【Python】从Excel中按行提取图片
java·python·excel
hkj88086 小时前
CRC-512算法输出64字节
算法
张二娃同学6 小时前
第08篇_RNN_LSTM_GRU序列模型
人工智能·python·rnn·深度学习·神经网络·gru·lstm