R语言——缺失值处理

目录

缺失数据

[1 R中的缺失值](#1 R中的缺失值)

2查看缺失值is.na()

[3 去除缺失值](#3 去除缺失值)


1 R中的缺失值

在R中,NA代表缺失值,NA是不可用(可能是0,可能是其他值,NA是未知的),notavailable的简称,用来存储缺失信息。NA不等于0

用na.rm这个参数,可以跳过这个NA进行计算:

2查看缺失值is.na()

复制代码
is.na(sleep)

查看数据集中的缺失值情况:

复制代码
colSums(sleep)
复制代码
rowSums(sleep)

可以看出每行每列的缺失值情况,只有全部没有 NA 才能进行求和:

3 去除缺失值

na.omit 函数可以去除向量中的缺失值:

而处理数据框中的缺失值,则是则是将包会缺失值的每行都删掉。

处理前:

处理后:

其他缺失值:

1、缺失数据NaN,代表不可能的值

2、Inf表示无穷,分为正无穷Inf和负无穷Inf,代表无穷大或者无穷小,

区别:

1、NA是存在的值,但是不知道是多少

2、NaN是不存在的

3、Inf存在,是无无穷大后者无穷小,但是表示不可能的值.

也有函数对应查看:

> is.nan(0/0)

> is.infinite(1/0)

相关推荐
善木科研1 天前
读文献先读图:GO弦图怎么看?
机器学习·数据分析·r语言
Tiger Z1 天前
R 语言科研绘图第 55 期 --- 网络图-聚类
开发语言·r语言·贴图
十三画者1 天前
【数据分析】R版IntelliGenes用于生物标志物发现的可解释机器学习
python·机器学习·数据挖掘·数据分析·r语言·数据可视化
lishaoan774 天前
实验设计与分析(第6版,Montgomery著,傅珏生译) 第10章拟合回归模型10.9节思考题10.12 R语言解题
回归·r语言·线性回归·残差分析·实验设计与数据分析·回归显著性
南瓜胖胖4 天前
【R语言编程绘图-mlbench】
开发语言·机器学习·r语言
天桥下的卖艺者4 天前
R语言使用随机过采样(Random Oversampling)平衡数据集
开发语言·r语言
Biomamba生信基地5 天前
R语言基础| 创建数据集
开发语言·r语言·生信·医药
lishaoan775 天前
实验设计与分析(第6版,Montgomery)第5章析因设计引导5.7节思考题5.19 R语言解题
r语言·方差分析·实验设计与分析·残差分析·正态假设·交互作用
weixin_493202636 天前
R语言错误处理方法大全
开发语言·r语言
lishaoan776 天前
实验设计与分析(第6版,Montgomery)第4章随机化区组,拉丁方, 及有关设计4.5节思考题4.1~4.4 R语言解题
r语言·统计分析·方差分析·实验设计与分析·随机化区组