R语言——缺失值处理

目录

缺失数据

[1 R中的缺失值](#1 R中的缺失值)

2查看缺失值is.na()

[3 去除缺失值](#3 去除缺失值)


1 R中的缺失值

在R中,NA代表缺失值,NA是不可用(可能是0,可能是其他值,NA是未知的),notavailable的简称,用来存储缺失信息。NA不等于0

用na.rm这个参数,可以跳过这个NA进行计算:

2查看缺失值is.na()

复制代码
is.na(sleep)

查看数据集中的缺失值情况:

复制代码
colSums(sleep)
复制代码
rowSums(sleep)

可以看出每行每列的缺失值情况,只有全部没有 NA 才能进行求和:

3 去除缺失值

na.omit 函数可以去除向量中的缺失值:

而处理数据框中的缺失值,则是则是将包会缺失值的每行都删掉。

处理前:

处理后:

其他缺失值:

1、缺失数据NaN,代表不可能的值

2、Inf表示无穷,分为正无穷Inf和负无穷Inf,代表无穷大或者无穷小,

区别:

1、NA是存在的值,但是不知道是多少

2、NaN是不存在的

3、Inf存在,是无无穷大后者无穷小,但是表示不可能的值.

也有函数对应查看:

> is.nan(0/0)

> is.infinite(1/0)

相关推荐
劳工搬砖记录bot_ssprott7 小时前
conda全流程安装seurat4及其依赖 | 包含各类报错解决
r语言·conda
白杆杆红伞伞13 小时前
R_常用函数
开发语言·r语言
QH_ShareHub14 小时前
Rstudio 与 R 打开 Rdata (压缩文件) 差异
java·前端·r语言
浩浩kids1 天前
R•Homework
开发语言·r语言
AI科技星2 天前
基于wr/c + h/c = 1的螺旋线矢量特性及应用分析
c语言·开发语言·人工智能·opencv·算法·计算机视觉·r语言
探序基因5 天前
R语言读取单细胞转录组基因表达矩阵loom文件
开发语言·r语言
房开民6 天前
paddle 文本检测识别模型转为onnx
开发语言·r语言·paddle
全栈开发圈6 天前
干货分享|R语言聚类分析2
人工智能·机器学习·r语言
全栈开发圈8 天前
干货分享|R语言聚类分析1
开发语言·r语言
AI科技星11 天前
空间光速螺旋动力学:统一质量、引力、电磁与时空本源的公理化理论与全现象验证
c语言·开发语言·opencv·算法·r语言