R整理数据技巧

根据姓名和日期排序后,给一列排序号

r 复制代码
df %>%
	arrange(姓名, 日期) %>%
	group_by(姓名) %>%
 	mutate(record_rank = row_number()) %>%
  	dplyr::ungroup()

如果事件1出现后,后面所有的值用NA填充

针对在进行整理生存分析数据时

r 复制代码
df %>%
  arrange(姓名, record_rank) %>%
  group_by(姓名) %>%
  mutate(mark = cumsum(status == 1)) %>%
  mutate(new_status = if_else(mark <= 1, status, NA)) %>%
  ungroup() %>%
  mutate(new_status = ifelse(is.na(new_status), 0, new_status))

向上或向下填充NA值

r 复制代码
df %>% 
  group_by(姓名) %>% 
  fill(feature1, .direction = 'up') %>%
  fill(feature1, .direction = 'down')
相关推荐
高-老师4 小时前
基于R语言的贝叶斯网络模型的实践技术应用;R语言实现Bayesian Network分析的基本流程
开发语言·r语言·贝叶斯网络
AC赳赳老秦19 小时前
科研数据叙事:DeepSeek将实验数据转化为故事化分析框架
开发语言·人工智能·数据分析·r语言·时序数据库·big data·deepseek
Kratzdisteln1 天前
【MCM】((N_G,N_A)) 可行域; ((C_R,c_E)) 分区图
c语言·开发语言·r语言
张小凡vip1 天前
数据挖掘(八)--让Jupyter notebook支持R语言环境
jupyter·数据挖掘·r语言
青灯照颦微2 天前
【R】三种方式安装R包
开发语言·r语言
weixin_462446233 天前
PaddleX 3.2 人脸识别实战:自定义人脸库 + CartoonFace 官方案例 Top-K 识别完整指南
开发语言·r语言
Tiger Z3 天前
《R for Data Science (2e)》免费中文翻译 (第19章) --- Joins(1)
r语言·编程·数据科学
Tiger Z3 天前
《R for Data Science (2e)》免费中文翻译 (第18章) --- Missing values
开发语言·r语言
带我去滑雪3 天前
R语言抑郁症状网络分析
r语言