机器学习算法系列————决策树(二)

1.什么是决策树

用于解决分类问题的一种算法。

左边是属性,右边是标签。

属性选择时用什么度量,分别是信息熵和基尼系数。

这里能够做出来特征的区分。

下图为基尼系数为例进行计算。

下面两张图是对婚姻和年收入的详细计算过程(为GINI系数为例。)决策树连接一是以信息熵为例进行计算的。

这里需要声明一下,可能作者计算的分类方式为(0-60k)(60k-80k)(80k-300k)

最终建立好的决策树模型如下。

相关推荐
爱丽_22 分钟前
ThreadLocal 机制:弱引用 Entry、内存泄漏、线程池复用与线上排查
java·jvm·算法
2301_8154829330 分钟前
C++编译期矩阵运算
开发语言·c++·算法
☆56635 分钟前
C++中的类型擦除技术
开发语言·c++·算法
m0_5698814740 分钟前
C++与自动驾驶系统
开发语言·c++·算法
2401_833197731 小时前
C++代码切片分析
开发语言·c++·算法
月落归舟1 小时前
每日算法题 14---14.环形链表
数据结构·算法·链表
m0_621438521 小时前
实时音频处理C++实现
开发语言·c++·算法
weixin_421922691 小时前
模板代码性能测试
开发语言·c++·算法
Liu628881 小时前
C++中的模板方法模式
开发语言·c++·算法
qq_334903151 小时前
高性能网络协议栈
开发语言·c++·算法