R语言生存分析算法的简单组合

复制代码
library(survival)
library(randomForestSRC)

# 生成模拟数据
set.seed(123)
n <- 200
time <- rexp(n, rate = 0.1)
status <- rbinom(n, size = 1, prob = 0.7)
var1 <- rnorm(n)
var2 <- rnorm(n)
var3 <- rnorm(n)
data1 <- data.frame(time = time, status = status, var1 = var1, var2 = var2, var3 = var3)

# 定义模型列表
models <- list(
  cox = function(data) {
    fit <- survival::coxph(Surv(time,status) ~ .,data=data)
    sum<-summary(fit)[["coefficients"]][,5] 
    canshu<-names(sum)
    result<-list(fit=fit,canshu=canshu)
    return(result)
  },
  rsf=function(data){
    fit<-rfsrc(Surv(time,status) ~ .,data=data1)
    canshu<-var.select(object=fit,
                       method="md",
                       conservative="low")$md.obj$topvars.1se
    result<-list(fit=fit,canshu=canshu)
    return(result)
  }
)

# 列举所有模型组合(考虑顺序)
model<-c("cox","rsf")
all_combinations <- list()
library(gtools)
for (n in 1:length(model)) {
  permutations <- permutations(2,n,v=model)
  mat_list <- apply(permutations, 1, function(row) paste(row, collapse = ","))
  mat_vector_list <- lapply(mat_list, function(str) unlist(strsplit(str, ",")))
  all_combinations <- c(all_combinations, mat_vector_list)
}
model_combinations<-all_combinations

# 循环遍历不同模型组合
selected_vars_final <- list()
for (i in 1:length(model_combinations)) {
  comb <- model_combinations[[i]]
  selected_vars <- NULL
  # 循环遍历每个模型类型
  data1<-lung
  for (model_name in comb) {
    i=1
    if (grep(model_name,comb)==1) {
      # 根据前一步的选择变量建立模型并筛选变量
      result <- models[[model_name]](data1)
      cat("第一步:",model_name,"---",result$canshu,"\n")
    } else {
      vc=paste("c(", paste(sprintf('"%s"', selected_vars), collapse = ","), ")", sep = "")
      cat("纳入第二步的因素:",model_name,"---",vc,"\n")
      selected_data <-  data.frame(data1[,eval(parse(text = vc))],
                                   data1[,c("time","status")])
      result <- models[[model_name]](selected_data)
    }
    # 更新选定变量
    selected_vars <- result$canshu
  }
  selected_vars_final[[paste(comb, collapse = "_")]] <- selected_vars
}

print(selected_vars_final)
相关推荐
梦想的初衷~6 小时前
生命周期评价(LCA):理论、方法与工具、典型案例全解析
r语言·农业·林业·环境科学·地理·气候变化·生命周期评价
asyxchenchong88812 小时前
OpenLCA、GREET、R语言的生命周期评价方法、模型构建
开发语言·r语言
没有梦想的咸鱼185-1037-166312 小时前
【生命周期评价(LCA)】基于OpenLCA、GREET、R语言的生命周期评价方法、模型构建
开发语言·数据分析·r语言
zhangfeng11332 天前
亲测有效的mem 流行病预测,时间序列预测,r语言做移动流行区间法,MEM流行病阈值设置指南
开发语言·r语言·生物信息
普通网友3 天前
Golang笔记——Interface类型
r语言
maizeman1263 天前
用R语言生成指定品种与对照的一元回归直线(含置信区间)
开发语言·回归·r语言·置信区间·品种测试
兮兮能吃能睡4 天前
R语言模型分析(一)(1)
开发语言·r语言
Tiger Z4 天前
《R for Data Science (2e)》免费中文翻译 (第11章) --- Communication(2)
r语言·数据科学·中文翻译
zhangfeng11334 天前
win7 VSCode 1.70设置R语言的版本,电脑上有两个版本
ide·vscode·r语言
stayhungry_c5 天前
Quarto生成PDF无法正常显示中文的问题
python·macos·r语言·pdf