R语言——缺失值处理

目录

缺失数据

[1 R中的缺失值](#1 R中的缺失值)

2查看缺失值is.na()

[3 去除缺失值](#3 去除缺失值)


1 R中的缺失值

在R中,NA代表缺失值,NA是不可用(可能是0,可能是其他值,NA是未知的),notavailable的简称,用来存储缺失信息。NA不等于0

用na.rm这个参数,可以跳过这个NA进行计算:

2查看缺失值is.na()

复制代码
is.na(sleep)

查看数据集中的缺失值情况:

复制代码
colSums(sleep)
复制代码
rowSums(sleep)

可以看出每行每列的缺失值情况,只有全部没有 NA 才能进行求和:

3 去除缺失值

na.omit 函数可以去除向量中的缺失值:

而处理数据框中的缺失值,则是则是将包会缺失值的每行都删掉。

处理前:

处理后:

其他缺失值:

1、缺失数据NaN,代表不可能的值

2、Inf表示无穷,分为正无穷Inf和负无穷Inf,代表无穷大或者无穷小,

区别:

1、NA是存在的值,但是不知道是多少

2、NaN是不存在的

3、Inf存在,是无无穷大后者无穷小,但是表示不可能的值.

也有函数对应查看:

> is.nan(0/0)

> is.infinite(1/0)

相关推荐
余醉 | dtminer19 小时前
R语言常见新手问题
开发语言·r语言
佳哥的技术分享21 小时前
Function<T, R> 中 apply,compose, andThen 方法总结
java·学习·r语言
2501_942191772 天前
纺织品微观缺陷检测与分类:基于Faster R-CNN的改进模型实现与性能优化_1
分类·r语言·cnn
TDengine (老段)2 天前
TDengine R 语言连接器进阶指南
大数据·开发语言·数据库·r语言·时序数据库·tdengine·涛思数据
Katecat996633 天前
肾衰竭医学影像多类别目标检测:基于Mask R-CNN的囊肿、肾脏、结石和肿瘤六类病变特征识别_1
目标检测·r语言·cnn
2501_942191773 天前
使用Faster R-CNN实现网球球检测:基于R50-FPN-MS-3x模型的COCO数据集训练与优化
目标跟踪·r语言·cnn
2501_941329723 天前
长豆荚目标检测:Faster R-CNN改进模型实战与优化
目标检测·r语言·cnn
一口面条一口蒜3 天前
R 包构建 + GitHub 部署全流程
开发语言·r语言·github
Katecat996633 天前
肾脏超声图像质量评估与分类系统实现(附Mask R-CNN模型训练)_1
分类·r语言·cnn
TDengine (老段)3 天前
TDengine R 语言连接器入门指南
大数据·数据库·物联网·r语言·时序数据库·tdengine·涛思数据