机器学习算法系列————决策树(二)

1.什么是决策树

用于解决分类问题的一种算法。

左边是属性,右边是标签。

属性选择时用什么度量,分别是信息熵和基尼系数。

这里能够做出来特征的区分。

下图为基尼系数为例进行计算。

下面两张图是对婚姻和年收入的详细计算过程(为GINI系数为例。)决策树连接一是以信息熵为例进行计算的。

这里需要声明一下,可能作者计算的分类方式为(0-60k)(60k-80k)(80k-300k)

最终建立好的决策树模型如下。

相关推荐
3壹2 分钟前
数据结构精讲:栈与队列实战指南
c语言·开发语言·数据结构·c++·算法
skytier37 分钟前
Construct内报错和定位解决
算法
skytier41 分钟前
Ascend print数据落盘使用
算法
etcix1 小时前
dmenux.c: integrate dmenu project as one file
c语言·前端·算法
papership1 小时前
【入门级-算法-6、排序算法:选择排序】
数据结构·算法·排序算法
汉克老师2 小时前
第十四届蓝桥杯青少组C++选拔赛[2023.2.12]第二部分编程题(4、最大空白区)
c++·算法·蓝桥杯·蓝桥杯c++·c++蓝桥杯
共享家95272 小时前
优先搜索(DFS)实战
算法·leetcode·深度优先
一只懒洋洋2 小时前
中值滤波、方框滤波、高斯滤波、均值滤波、膨胀、腐蚀、开运算、闭运算
算法·均值算法
shellvon2 小时前
你怎么被识别的?从TLS到Canvas的设备追踪术
后端·算法
薛定谔的算法2 小时前
JavaScript栈的实现与应用:从基础到实战
前端·javascript·算法