技术栈
分类变量
deephub
6 小时前
python
·
机器学习
·
特征工程
·
分类变量
机器学习特征工程:分类变量的数值化处理方法
编码是机器学习流程里最容易被低估的环节之一,模型没办法直接处理文本形式的分类数据,尺寸(Small/Medium/Large)、颜色(Red/Blue/Green)、城市、支付方式等都是典型的分类特征,必须转成数值才能输入到模型中。
FreedomLeo1
1 年前
python
·
机器学习
·
数据表示与特征工程
·
分类变量
·
连续特征
·
分类特征
Python机器学习笔记(十六、数据表示与特征工程-分类变量)
在机器学习的过程中,我们一般假设数据是由浮点数组成的二维数组,每一列描述数据点的连续特征(continuous feature)。但真实情况下,数据并不一定按照这种方式收集。
我是有底线的