机器学习——决策树

基本概念:

决策树广泛应用于分类和回归问题。

决策树以一种树状结构表示决策过程,每个内部节点表示一个特征或属性,每个分支表示测试的结果,每个叶子节点代表一个值或类别。

纯度:衡量一个子集中的样本类别是否一致。纯度越高,说明子集中的样本越相似。

基尼系数:用于分类的分裂标准,选择划分后基尼系数最小或纯度最大的特征,基尼系数为0表示完全纯净。

信息增益:衡量某一特征后的纯度提升。

决策树能展现完整的决策过程,相较于回归而言,有清晰的链路。

决策树不需要对数据进行归一化。

一般需要限制树的高度,如:3层,高于3层不再继续分裂。

缺点:

1.容易过拟合。

如果不限制决策额数,他会为了把每一个异常值分对,长出无数繁琐的分支,所以需要剪枝,只保留核心主干。

1)预剪枝

限制最大深度

限制叶节点最少样本数

2)后剪枝

先让树肆无忌惮生长,然后自下而上减掉非关键分支。效果更好,但是计算量大。

决策树延伸

随机森林:多颗相互独立的决策树,解决单树稳定性差,容易过拟合的问题。

每次抽取部分数据和特征,面对未知数据,所有树独立预测,投票表决。

梯度提升树(GBDT、XGBoost、LightGBM)

树之间不再独立,前赴后继,第二棵树专门纠正第一棵树的错误,不断迭代提升精度。

相关推荐
3DVisionary2 分钟前
告别数据中断:XTDIC-VG视频引伸计在金属疲劳测试中3个真实案例
人工智能·音视频·应用案例·xtdic-vg·视频引伸计·疲劳测试·实战复盘
大鱼>2 分钟前
边缘AI实时推理优化:从30FPS到120FPS的系统级加速方法
人工智能·aiot
沫儿笙7 分钟前
川崎机器人二保焊节气设备
人工智能·机器人
跨境摸鱼9 分钟前
年中政策切换窗口临近跨境卖家如何安排新品测试与库存回收
大数据·人工智能·跨境电商·跨境·营销策略
csdndeyeye15 分钟前
拆解AI投简历插件:塔塔网申的技术逻辑和实测数据
人工智能·自动化·秋招·ai投简历插件·ai找工作·求职助手·应届生就业
测试工程师成长之路21 分钟前
2026版AI辅助开发工具链:从辅助到协同的范式跃迁
人工智能
yugi98783826 分钟前
PNCC(Power-Normalized Cepstral Coefficients)— MATLAB 实现
开发语言·人工智能·matlab
AI棒棒牛28 分钟前
第 03 讲《监督学习:数据、标签、Loss与训练循环》
人工智能·学习·yolo·目标检测·yolo26
甲维斯28 分钟前
GLM5.2超过Opus4.8Think,全球第二了!
前端·人工智能·ai编程
宝贝儿好34 分钟前
【LLM】第二章:HuggingFace入门学习
人工智能·深度学习·神经网络·学习·算法·自然语言处理