R语言——缺失值处理

目录

缺失数据

[1 R中的缺失值](#1 R中的缺失值)

2查看缺失值is.na()

[3 去除缺失值](#3 去除缺失值)


1 R中的缺失值

在R中,NA代表缺失值,NA是不可用(可能是0,可能是其他值,NA是未知的),notavailable的简称,用来存储缺失信息。NA不等于0

用na.rm这个参数,可以跳过这个NA进行计算:

2查看缺失值is.na()

复制代码
is.na(sleep)

查看数据集中的缺失值情况:

复制代码
colSums(sleep)
复制代码
rowSums(sleep)

可以看出每行每列的缺失值情况,只有全部没有 NA 才能进行求和:

3 去除缺失值

na.omit 函数可以去除向量中的缺失值:

而处理数据框中的缺失值,则是则是将包会缺失值的每行都删掉。

处理前:

处理后:

其他缺失值:

1、缺失数据NaN,代表不可能的值

2、Inf表示无穷,分为正无穷Inf和负无穷Inf,代表无穷大或者无穷小,

区别:

1、NA是存在的值,但是不知道是多少

2、NaN是不存在的

3、Inf存在,是无无穷大后者无穷小,但是表示不可能的值.

也有函数对应查看:

> is.nan(0/0)

> is.infinite(1/0)

相关推荐
dongf201919 小时前
R语言朴素贝叶斯算法---iris数据集
开发语言·算法·数据分析·r语言
All_Will_Be_Fine噻20 小时前
重建R环境
开发语言·r语言
梦想的初衷~20 小时前
基于R语言APSIM模型高级应用及批量模拟
r语言·apsim·作物生长模型·农业模拟·气象数据处理·土壤水分平衡
dongf201920 小时前
R 语言 逻辑斯蒂回归
开发语言·数据分析·回归·r语言
dongf20193 天前
R 语言 Apriori 关联规则算法
数据分析·r语言·关联规则
dongf20194 天前
R语言决策树剪枝----泰坦尼克数据集
决策树·r语言·剪枝
dongf20194 天前
R语言分类决策数算法----iris数据集
分类·数据分析·r语言
dongf20194 天前
R语言决策树----mtcars数据集
决策树·r语言
稷下元歌4 天前
七天学会plc加机器视觉之AI 接入 外设模块开发全详细操作文档(全程配套视频按文档实操)
python·sql·qt·贪心算法·r语言·wpf·时序数据库
dongf20194 天前
R 语言随机森林算法
算法·随机森林·r语言