【Python】【机器学习】集成算法(随机森林、提升算法)

bagging类似集成电路的并联,取平均;boosting类似串联,加强。

Bagging



神经网络是黑盒,判断逻辑不可解释

feature importance的原理:

计算特征组ABCD和AB'CD的结果,(B'是B数据的破坏或随机打乱或随机加入噪音点干扰值),在使用相同模型下:

AB'CD的结果如果与ABCD结果差不多,则B特征不重要;

如果err(AB'CD)>>err(ABCD),则B特征重要。

Boosting

AdaBoot算法会把上一次预测错的数据的权重增大。

Xgboost一步步处理二八原则的二。如100数据样本,第一棵树预测的error有20,第二棵树的样本是从这20中进一步预测,而非从100预测。以此类推。最终的预测结果是树1+树2+...+树N。效率低但效果好。

Stacking

相关推荐
kong79069281 小时前
Python核心语法-Matplotlib简介
开发语言·python·matplotlib
马克Markorg2 小时前
基于LLM的大模型的RAG(检索增强生成)实现对比
python·大模型·agent·rag·企业级知识库的框架·rag 知识库
小龙报2 小时前
【算法通关指南:数据结构与算法篇】二叉树相关算法题:1.二叉树深度 2.求先序排列
c语言·开发语言·数据结构·c++·算法·贪心算法·动态规划
yy.y--2 小时前
Java线程实现浏览器实时时钟
java·linux·开发语言·前端·python
吾在学习路2 小时前
AoP-SAM: Automation of Prompts for Efficient Segmentation
人工智能·深度学习·算法·计算机视觉
Dontla2 小时前
Python Streamlit介绍(开源Python Web应用框架,快速将Python脚本转换成交互式Web应用,适合数据科学和机器学习项目快速展示)
前端·python·开源
再难也得平2 小时前
[LeetCode刷题]1.两数之和(java题解)
java·算法·leetcode
皮卡蛋炒饭.2 小时前
钻石收集者&是7倍数的最长子序列&Zuma
数据结构·算法·排序算法
plus4s2 小时前
2月20日(88-90题)
算法