R整理数据技巧

根据姓名和日期排序后,给一列排序号

r 复制代码
df %>%
	arrange(姓名, 日期) %>%
	group_by(姓名) %>%
 	mutate(record_rank = row_number()) %>%
  	dplyr::ungroup()

如果事件1出现后,后面所有的值用NA填充

针对在进行整理生存分析数据时

r 复制代码
df %>%
  arrange(姓名, record_rank) %>%
  group_by(姓名) %>%
  mutate(mark = cumsum(status == 1)) %>%
  mutate(new_status = if_else(mark <= 1, status, NA)) %>%
  ungroup() %>%
  mutate(new_status = ifelse(is.na(new_status), 0, new_status))

向上或向下填充NA值

r 复制代码
df %>% 
  group_by(姓名) %>% 
  fill(feature1, .direction = 'up') %>%
  fill(feature1, .direction = 'down')
相关推荐
GZ同学13 天前
单双变量Ripley’s K函数 R 语言实现
开发语言·r语言
popcorn_min14 天前
共享单车需求预测:时间特征工程 + 随机森林,R² 达到 0.931
随机森林·r语言·kotlin
m0_4970489318 天前
.NET10+Avalonia跨平台截屏工具解析
r语言
dongf201919 天前
R语言朴素贝叶斯算法---iris数据集
开发语言·算法·数据分析·r语言
All_Will_Be_Fine噻19 天前
重建R环境
开发语言·r语言
梦想的初衷~19 天前
基于R语言APSIM模型高级应用及批量模拟
r语言·apsim·作物生长模型·农业模拟·气象数据处理·土壤水分平衡
dongf201919 天前
R 语言 逻辑斯蒂回归
开发语言·数据分析·回归·r语言
dongf201922 天前
R 语言 Apriori 关联规则算法
数据分析·r语言·关联规则
dongf201922 天前
R语言决策树剪枝----泰坦尼克数据集
决策树·r语言·剪枝
dongf201922 天前
R语言分类决策数算法----iris数据集
分类·数据分析·r语言