R语言生存分析算法的简单组合

library(survival)
library(randomForestSRC)

# 生成模拟数据
set.seed(123)
n <- 200
time <- rexp(n, rate = 0.1)
status <- rbinom(n, size = 1, prob = 0.7)
var1 <- rnorm(n)
var2 <- rnorm(n)
var3 <- rnorm(n)
data1 <- data.frame(time = time, status = status, var1 = var1, var2 = var2, var3 = var3)

# 定义模型列表
models <- list(
  cox = function(data) {
    fit <- survival::coxph(Surv(time,status) ~ .,data=data)
    sum<-summary(fit)[["coefficients"]][,5] 
    canshu<-names(sum)
    result<-list(fit=fit,canshu=canshu)
    return(result)
  },
  rsf=function(data){
    fit<-rfsrc(Surv(time,status) ~ .,data=data1)
    canshu<-var.select(object=fit,
                       method="md",
                       conservative="low")$md.obj$topvars.1se
    result<-list(fit=fit,canshu=canshu)
    return(result)
  }
)

# 列举所有模型组合(考虑顺序)
model<-c("cox","rsf")
all_combinations <- list()
library(gtools)
for (n in 1:length(model)) {
  permutations <- permutations(2,n,v=model)
  mat_list <- apply(permutations, 1, function(row) paste(row, collapse = ","))
  mat_vector_list <- lapply(mat_list, function(str) unlist(strsplit(str, ",")))
  all_combinations <- c(all_combinations, mat_vector_list)
}
model_combinations<-all_combinations

# 循环遍历不同模型组合
selected_vars_final <- list()
for (i in 1:length(model_combinations)) {
  comb <- model_combinations[[i]]
  selected_vars <- NULL
  # 循环遍历每个模型类型
  data1<-lung
  for (model_name in comb) {
    i=1
    if (grep(model_name,comb)==1) {
      # 根据前一步的选择变量建立模型并筛选变量
      result <- models[[model_name]](data1)
      cat("第一步:",model_name,"---",result$canshu,"\n")
    } else {
      vc=paste("c(", paste(sprintf('"%s"', selected_vars), collapse = ","), ")", sep = "")
      cat("纳入第二步的因素:",model_name,"---",vc,"\n")
      selected_data <-  data.frame(data1[,eval(parse(text = vc))],
                                   data1[,c("time","status")])
      result <- models[[model_name]](selected_data)
    }
    # 更新选定变量
    selected_vars <- result$canshu
  }
  selected_vars_final[[paste(comb, collapse = "_")]] <- selected_vars
}

print(selected_vars_final)
相关推荐
一声沧海笑15 小时前
dplyr、tidyverse和ggplot2初探
信息可视化·数据分析·r语言
waterHBO19 小时前
R语言 基础笔记
开发语言·笔记·r语言
Red Red1 天前
GEO数据库提取疾病样本和正常样本|GEO数据库区分疾病和正常样本|直接用|生物信息|生信
开发语言·数据库·笔记·学习·r语言·c#·生物信息
邢博士谈科教3 天前
比传统机器学习更先进的深度学习神经网络的二分类建模全流程教程
数据挖掘·r语言·数据可视化
环能jvav大师5 天前
基于R语言的统计分析基础:使用键盘输入数据
开发语言·学习·数据分析·r语言·人机交互
Red Red5 天前
GEO数据的下载和处理|GEO数据转换为Gene symbol|GEO注释文件提取symbol|查看样本标签|查看GEO数据疾病或正常|生物信息基础
数据库·笔记·学习·r语言·生物信息·geo数据库
不是伍壹5 天前
【R语言】删除数据框中所有行中没有大于200的数值的行
开发语言·r语言
hongyanwin5 天前
商业预测 初识R
r语言·预测
maizeman1265 天前
R语言统计分析——用回归做ANOVA
回归·r语言·方差分析·anova·线性模型
武艺晴小朋友你好5 天前
基于scRNA-data,运用pySCENIC寻找细胞群里面活跃的调节子
r语言·数据可视化·r语言-4.2.1