【数据分析】缺失值处理

  1. 均值填充: 对于++数值型++ 的特征,采用该特征在已有数据中的++平均值或中位数++来填充缺失值。

  2. 众数填充: 对于++类别型++ 的特征,采用该特征在已有数据中++出现频率最高的类别++来填充缺失值。

  **3. 插值法:**通过已有的数据,推算出缺失值,常用的插值方法包括线性插值、多项式插值、样条插值等。

 ** 4. 预测模型填充:**采用其他特征的信息,通过建立模型来预测缺失值,常用的模型包括KNN、决策树、随机森林等。

  **5. 删除法:**对于缺失值比例较小的数据,可以考虑删除缺失值较多的行或列。

 ** 6. 中位数:**若数据呈偏态分布。

  

相关推荐
大连好光景13 小时前
BCELoss + sigmoid 换成 BCEWithLogitsLoss
人工智能·深度学习·机器学习
春日见16 小时前
RL精华知识
人工智能·机器学习
lqqjuly16 小时前
自动驾驶仿真平台:理论、架构与实践
人工智能·机器学习·自动驾驶
春日见17 小时前
五分钟入门 强化学习---DQN(Deep Q Net)算法与实现
人工智能·python·深度学习·算法·microsoft·机器学习
xzzd_jokelin17 小时前
公司AI开发痛点解析:多人+AI辅助 协同开发?
人工智能·机器学习·ai·ai编程·cloud·codex
香蕉也是布拉拉17 小时前
2026-05-29 arXiv 论文带读:GeoAI、空间智能与多模态 Agent 的 9 篇高质量新作
人工智能·机器学习
FL162386312920 小时前
窗户干净脏污分类窗户清洁状态分类数据集3299张2类别已划分训练验证测试集
人工智能·分类·数据挖掘
Quincy_Freak20 小时前
银河麒麟aarch64如何高效做数据分析?分享一款内网离线数据分析利器
大数据·数据库·数据挖掘·数据分析·aarch64
还不秃顶的计科生20 小时前
codex配置自动化visio/ppt
机器学习·visio
春日见20 小时前
五分钟入门 强化学习---Q-Learning算法与实现
人工智能·python·深度学习·算法·机器学习·计算机视觉