R整理数据技巧

根据姓名和日期排序后,给一列排序号

r 复制代码
df %>%
	arrange(姓名, 日期) %>%
	group_by(姓名) %>%
 	mutate(record_rank = row_number()) %>%
  	dplyr::ungroup()

如果事件1出现后,后面所有的值用NA填充

针对在进行整理生存分析数据时

r 复制代码
df %>%
  arrange(姓名, record_rank) %>%
  group_by(姓名) %>%
  mutate(mark = cumsum(status == 1)) %>%
  mutate(new_status = if_else(mark <= 1, status, NA)) %>%
  ungroup() %>%
  mutate(new_status = ifelse(is.na(new_status), 0, new_status))

向上或向下填充NA值

r 复制代码
df %>% 
  group_by(姓名) %>% 
  fill(feature1, .direction = 'up') %>%
  fill(feature1, .direction = 'down')
相关推荐
海大哥13 小时前
深入解析Java中HashMap的工作原理与性能优化策略
r语言
万粉变现经纪人1 天前
如何解决 pip install -r requirements.txt 约束文件 constraints.txt 仅允许固定版本(未锁定报错)问题
开发语言·python·r语言·django·beautifulsoup·pandas·pip
万粉变现经纪人1 天前
如何解决 pip install -r requirements.txt 无效可编辑项 ‘e .‘(-e 拼写错误)问题
开发语言·python·r语言·beautifulsoup·pandas·pip·scipy
zhangfeng11332 天前
亲测可用,R语言 ggplot2 箱线图线条控制参数详解,箱线图离散数值控制
开发语言·python·r语言·生物信息
zhangfeng11332 天前
R 导出 PDF 时中文不显示 不依赖 showtext** 的最简方案(用 extrafont 把系统 TTF 真正灌进 PDF 内核)
开发语言·r语言·pdf·生物信息
生物小卡拉2 天前
R脚本--PCA分析系列1_v1.0
开发语言·r语言
生物小卡拉2 天前
R脚本——LefSE分析与可视化-v1
开发语言·r语言
猫头虎4 天前
如何解决 pip install -r requirements.txt 本地轮子路径 ‘./packages/xxx.whl’ 不存在 问题
开发语言·网络·python·r语言·pip·gpu算力·国产
zhangfeng11334 天前
R语言 表达矩阵 count_table 筛选出 行名是 某个 基因的 数据或者某个列中的数据是某个基因的数据
矩阵·r语言·生物信息
zhangfeng11335 天前
geo Counts 数据 ,机器学习 模型的外部验证 ROC外部验证数据处理流程
人工智能·机器学习·r语言·生物信息