R整理数据技巧

根据姓名和日期排序后,给一列排序号

r 复制代码
df %>%
	arrange(姓名, 日期) %>%
	group_by(姓名) %>%
 	mutate(record_rank = row_number()) %>%
  	dplyr::ungroup()

如果事件1出现后,后面所有的值用NA填充

针对在进行整理生存分析数据时

r 复制代码
df %>%
  arrange(姓名, record_rank) %>%
  group_by(姓名) %>%
  mutate(mark = cumsum(status == 1)) %>%
  mutate(new_status = if_else(mark <= 1, status, NA)) %>%
  ungroup() %>%
  mutate(new_status = ifelse(is.na(new_status), 0, new_status))

向上或向下填充NA值

r 复制代码
df %>% 
  group_by(姓名) %>% 
  fill(feature1, .direction = 'up') %>%
  fill(feature1, .direction = 'down')
相关推荐
烟锁池塘柳06 小时前
【R语言】R 语言中打印含有双引号的字符串时会出现 “\” 的原因解析
r语言
全栈开发圈4 天前
干货分享|如何从0到1掌握R语言数据分析
开发语言·数据分析·r语言
小杜的生信筆記7 天前
基于R语言,“上百种机器学习模型”学习教程 | Mime包
开发语言·学习·机器学习·r语言·sci
在打豆豆的小潘学长7 天前
【R语言】多样本单细胞分析_SCTransform+Harmony方案(2)
开发语言·r语言
TS的美梦7 天前
ROGUE: 【张院士团队R包】一种基于熵的用于评估单细胞群体纯度的度量标准
开发语言·r语言
weixin_493202639 天前
R语言代码加密(1)
r语言
Tiger Z9 天前
《R for Data Science (2e)》免费中文翻译 (第3章) --- Data transformation(2)
r语言·数据科学·中文翻译
星石传说11 天前
使用R将nc文件转换为asc文件或者tif文件
r语言·生信
Mister Leon12 天前
机器学习Adaboost算法----SAMME算法和SAMME.R算法
算法·机器学习·r语言
Tiger Z13 天前
R 语言科研绘图第 67 期 --- 箱线图-显著性
r语言·论文·科研·绘图·研究生