【Python】【机器学习】集成算法(随机森林、提升算法)

bagging类似集成电路的并联,取平均;boosting类似串联,加强。

Bagging



神经网络是黑盒,判断逻辑不可解释

feature importance的原理:

计算特征组ABCD和AB'CD的结果,(B'是B数据的破坏或随机打乱或随机加入噪音点干扰值),在使用相同模型下:

AB'CD的结果如果与ABCD结果差不多,则B特征不重要;

如果err(AB'CD)>>err(ABCD),则B特征重要。

Boosting

AdaBoot算法会把上一次预测错的数据的权重增大。

Xgboost一步步处理二八原则的二。如100数据样本,第一棵树预测的error有20,第二棵树的样本是从这20中进一步预测,而非从100预测。以此类推。最终的预测结果是树1+树2+...+树N。效率低但效果好。

Stacking

相关推荐
aqi002 小时前
15天学会AI应用开发(九)利用Chroma持久化向量数据
人工智能·python·大模型·ai编程·ai应用
金銀銅鐵2 小时前
借助 Pygame 探索最大公约数的规律
python·数学·游戏
To_OC14 小时前
LC 128 最长连续序列:别上来就排序,O (n) 解法才是这题的灵魂
javascript·算法·leetcode
ServBay19 小时前
9 个 Python 第三方库推荐,不用 AI 都好像多出一个团队
后端·python
用户83562907805120 小时前
如何使用 Python 添加和管理 Excel 批注(完整示例)
后端·python
用户83562907805120 小时前
使用 Python 管理 Excel 工作表:创建、复制、删除与重命名
后端·python
Lihua奏21 小时前
# 机器学习:机器是怎么从数据里学出规则的
机器学习
饼干哥哥1 天前
用AI全自动剪辑,日更 100条爆款视频——HyperFrames、Remotion、Git使用入门
人工智能·机器学习·ai编程