【数据分析】缺失值处理

1. 均值填充: 对于++数值型++ 的特征,采用该特征在已有数据中的++平均值或中位数++来填充缺失值。

2. 众数填充: 对于++类别型++ 的特征,采用该特征在已有数据中++出现频率最高的类别++来填充缺失值。

**3. 插值法:**通过已有的数据,推算出缺失值,常用的插值方法包括线性插值、多项式插值、样条插值等。

** 4. 预测模型填充:**采用其他特征的信息,通过建立模型来预测缺失值,常用的模型包括KNN、决策树、随机森林等。

**5. 删除法:**对于缺失值比例较小的数据,可以考虑删除缺失值较多的行或列。

** 6. 中位数:**若数据呈偏态分布。

相关推荐
山间小僧3 小时前
「AI学习笔记」RNN
机器学习·aigc·ai编程
AI前沿晓猛哥5 小时前
2026年安卓加固工具横向对比:哪个防护效果最好且不卡顿?
数据挖掘
春末的南方城市10 小时前
比肩顶尖闭源模型!京东开源240亿参数多模态模型JoyAI-Image:统一理解/生成/编辑,重塑AI图像编辑。
人工智能·深度学习·机器学习·计算机视觉·aigc
哥布林学者11 小时前
深度学习进阶(七)Data-efficient Image Transformer
机器学习·ai
做cv的小昊11 小时前
【TJU】应用统计学——第五周作业(3.1 假设检验的基本思想、3.2 单个正态总体参数的假设检验)
学习·线性代数·机器学习·数学建模·矩阵·概率论·tju
kyle-fang11 小时前
大模型微调
人工智能·深度学习·机器学习
Master_oid11 小时前
机器学习38:距离度量与特征处理
人工智能·机器学习
Hello.Reader11 小时前
为什么学线性代数(一)
线性代数·算法·机器学习
网络工程小王12 小时前
【大模型基础部署】(学习笔记)
人工智能·深度学习·机器学习