【数据分析】缺失值处理

  1. 均值填充: 对于++数值型++ 的特征,采用该特征在已有数据中的++平均值或中位数++来填充缺失值。

  2. 众数填充: 对于++类别型++ 的特征,采用该特征在已有数据中++出现频率最高的类别++来填充缺失值。

  **3. 插值法:**通过已有的数据,推算出缺失值,常用的插值方法包括线性插值、多项式插值、样条插值等。

 ** 4. 预测模型填充:**采用其他特征的信息,通过建立模型来预测缺失值,常用的模型包括KNN、决策树、随机森林等。

  **5. 删除法:**对于缺失值比例较小的数据,可以考虑删除缺失值较多的行或列。

 ** 6. 中位数:**若数据呈偏态分布。

  

相关推荐
Lihua奏1 天前
# 机器学习:机器是怎么从数据里学出规则的
机器学习
饼干哥哥1 天前
用AI全自动剪辑,日更 100条爆款视频——HyperFrames、Remotion、Git使用入门
人工智能·机器学习·ai编程
饼干哥哥1 天前
开源Skills|搭建亚马逊动态关键词库系统,每天抓SSS级机会词
人工智能·深度学习·数据分析
魏祖潇3 天前
我在飞书里养了个“分身”——私聊喊它办事,群里 @ 它干活,还能替我传话
人工智能·机器学习
倔强的石头_3 天前
企业工商数据源站点:无验证无拦截,批量获取工商数据完整方案
数据分析
哥布林学者8 天前
深度学习进阶(三十一)FlashAttention:IO 感知的精确注意力
机器学习·ai