R语言——缺失值处理

目录

缺失数据

[1 R中的缺失值](#1 R中的缺失值)

2查看缺失值is.na()

[3 去除缺失值](#3 去除缺失值)


1 R中的缺失值

在R中,NA代表缺失值,NA是不可用(可能是0,可能是其他值,NA是未知的),notavailable的简称,用来存储缺失信息。NA不等于0

用na.rm这个参数,可以跳过这个NA进行计算:

2查看缺失值is.na()

复制代码
is.na(sleep)

查看数据集中的缺失值情况:

复制代码
colSums(sleep)
复制代码
rowSums(sleep)

可以看出每行每列的缺失值情况,只有全部没有 NA 才能进行求和:

3 去除缺失值

na.omit 函数可以去除向量中的缺失值:

而处理数据框中的缺失值,则是则是将包会缺失值的每行都删掉。

处理前:

处理后:

其他缺失值:

1、缺失数据NaN,代表不可能的值

2、Inf表示无穷,分为正无穷Inf和负无穷Inf,代表无穷大或者无穷小,

区别:

1、NA是存在的值,但是不知道是多少

2、NaN是不存在的

3、Inf存在,是无无穷大后者无穷小,但是表示不可能的值.

也有函数对应查看:

> is.nan(0/0)

> is.infinite(1/0)

相关推荐
高-老师1 天前
基于R语言的贝叶斯网络模型的实践技术应用;R语言实现Bayesian Network分析的基本流程
开发语言·r语言·贝叶斯网络
AC赳赳老秦2 天前
科研数据叙事:DeepSeek将实验数据转化为故事化分析框架
开发语言·人工智能·数据分析·r语言·时序数据库·big data·deepseek
Kratzdisteln2 天前
【MCM】((N_G,N_A)) 可行域; ((C_R,c_E)) 分区图
c语言·开发语言·r语言
张小凡vip2 天前
数据挖掘(八)--让Jupyter notebook支持R语言环境
jupyter·数据挖掘·r语言
青灯照颦微3 天前
【R】三种方式安装R包
开发语言·r语言
weixin_462446234 天前
PaddleX 3.2 人脸识别实战:自定义人脸库 + CartoonFace 官方案例 Top-K 识别完整指南
开发语言·r语言
Tiger Z4 天前
《R for Data Science (2e)》免费中文翻译 (第19章) --- Joins(1)
r语言·编程·数据科学
Tiger Z4 天前
《R for Data Science (2e)》免费中文翻译 (第18章) --- Missing values
开发语言·r语言
带我去滑雪4 天前
R语言抑郁症状网络分析
r语言