R整理数据技巧

根据姓名和日期排序后,给一列排序号

r 复制代码
df %>%
	arrange(姓名, 日期) %>%
	group_by(姓名) %>%
 	mutate(record_rank = row_number()) %>%
  	dplyr::ungroup()

如果事件1出现后,后面所有的值用NA填充

针对在进行整理生存分析数据时

r 复制代码
df %>%
  arrange(姓名, record_rank) %>%
  group_by(姓名) %>%
  mutate(mark = cumsum(status == 1)) %>%
  mutate(new_status = if_else(mark <= 1, status, NA)) %>%
  ungroup() %>%
  mutate(new_status = ifelse(is.na(new_status), 0, new_status))

向上或向下填充NA值

r 复制代码
df %>% 
  group_by(姓名) %>% 
  fill(feature1, .direction = 'up') %>%
  fill(feature1, .direction = 'down')
相关推荐
Tiger Z2 天前
《R for Data Science (2e)》免费中文翻译 (第12章) --- Logical vectors(1)
数据分析·r语言·数据科学·免费书籍
AI纪元故事会3 天前
《目标检测全解析:从R-CNN到DETR,六大经典模型深度对比与实战指南》
人工智能·yolo·目标检测·r语言·cnn
小八四爱吃甜食4 天前
【R语言】构建GO、KEGG相关不同物种的R包
开发语言·golang·r语言
梦想的初衷~5 天前
生命周期评价(LCA):理论、方法与工具、典型案例全解析
r语言·农业·林业·环境科学·地理·气候变化·生命周期评价
asyxchenchong8885 天前
OpenLCA、GREET、R语言的生命周期评价方法、模型构建
开发语言·r语言
没有梦想的咸鱼185-1037-16635 天前
【生命周期评价(LCA)】基于OpenLCA、GREET、R语言的生命周期评价方法、模型构建
开发语言·数据分析·r语言
zhangfeng11336 天前
亲测有效的mem 流行病预测,时间序列预测,r语言做移动流行区间法,MEM流行病阈值设置指南
开发语言·r语言·生物信息
普通网友7 天前
Golang笔记——Interface类型
r语言
maizeman1268 天前
用R语言生成指定品种与对照的一元回归直线(含置信区间)
开发语言·回归·r语言·置信区间·品种测试
兮兮能吃能睡8 天前
R语言模型分析(一)(1)
开发语言·r语言