【数据分析】缺失值处理

1. 均值填充: 对于++数值型++ 的特征,采用该特征在已有数据中的++平均值或中位数++来填充缺失值。

2. 众数填充: 对于++类别型++ 的特征,采用该特征在已有数据中++出现频率最高的类别++来填充缺失值。

**3. 插值法:**通过已有的数据,推算出缺失值,常用的插值方法包括线性插值、多项式插值、样条插值等。

** 4. 预测模型填充:**采用其他特征的信息,通过建立模型来预测缺失值,常用的模型包括KNN、决策树、随机森林等。

**5. 删除法:**对于缺失值比例较小的数据,可以考虑删除缺失值较多的行或列。

** 6. 中位数:**若数据呈偏态分布。

相关推荐
YangYang9YangYan2 分钟前
职业本科发展路径与规划指南
大数据·人工智能·学习·数据分析
码上地球1 小时前
大数据成矿预测系列(九) | 数据的“自我画像”:自编码器如何实现非监督下的“特征学习”
人工智能·深度学习·机器学习·数学建模
程序员小羊!1 小时前
电商项目练习实操(二)
大数据·数据分析·etl·flume
谅望者1 小时前
数据分析笔记01:数据分析概述
大数据·数据库·数据仓库·数据分析
xuehaikj4 小时前
苹果质量检测与分类 - YOLO13结合RFCAConv实现
人工智能·数据挖掘
xuehaikj4 小时前
芦笋嫩茎形态分类与识别_YOLO11-C3k2-MambaOut-SFSC模型实现_1
人工智能·数据挖掘
qunshankeji4 小时前
YOLOv8-SOEP-RFPN-MFM水果智能分类与检测模型实现
yolo·分类·数据挖掘
北邮刘老师4 小时前
智能家居,需要的是“主控智能体”而不是“主控节点”
人工智能·算法·机器学习·智能体·智能体互联网
Blossom.1185 小时前
大模型量化压缩实战:从FP16到INT4的生产级精度保持之路
开发语言·人工智能·python·深度学习·神经网络·目标检测·机器学习
K2_BPM5 小时前
打通 AI 与业务的 “最后一公里”:流程优化的底层逻辑与三种战略选择
人工智能·机器学习