机器学习算法系列————决策树(二)

1.什么是决策树

用于解决分类问题的一种算法。

左边是属性,右边是标签。

属性选择时用什么度量,分别是信息熵和基尼系数。

这里能够做出来特征的区分。

下图为基尼系数为例进行计算。

下面两张图是对婚姻和年收入的详细计算过程(为GINI系数为例。)决策树连接一是以信息熵为例进行计算的。

这里需要声明一下,可能作者计算的分类方式为(0-60k)(60k-80k)(80k-300k)

最终建立好的决策树模型如下。

相关推荐
cwj&xyp16 分钟前
Python(二)str、list、tuple、dict、set
前端·python·算法
机智的叉烧1 小时前
前沿重器[57] | sigir24:大模型推荐系统的文本ID对齐学习
人工智能·学习·机器学习
xiaoshiguang34 小时前
LeetCode:222.完全二叉树节点的数量
算法·leetcode
爱吃西瓜的小菜鸡5 小时前
【C语言】判断回文
c语言·学习·算法
别NULL5 小时前
机试题——疯长的草
数据结构·c++·算法
TT哇5 小时前
*【每日一题 提高题】[蓝桥杯 2022 国 A] 选素数
java·算法·蓝桥杯
yuanbenshidiaos6 小时前
C++----------函数的调用机制
java·c++·算法
唐叔在学习6 小时前
【唐叔学算法】第21天:超越比较-计数排序、桶排序与基数排序的Java实践及性能剖析
数据结构·算法·排序算法
ALISHENGYA6 小时前
全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之分支结构(switch语句)
数据结构·算法