R语言实现随机生存森林(3)

常见问题解答

1、计算C指数

1-Error rate,或者

复制代码
rsf.err <- get.cindex(yvar$Survival_months,yvar$OS,predicted=rf.grow$predicted)

2、模型中predicted和predicted.oob区别

predictedpredicted.oob是两个不同的属性,它们分别表示模型的预测结果和袋外(out-of-bag)预测结果。predicted是指通过随机森林模型对训练数据的预测结果。当你使用模型来对训练数据进行预测时,predicted会给出每个样本的预测值。predicted.oob是指模型对袋外(out-of-bag)样本的预测结果。袋外样本是在随机森林的构建中没有被用于训练的样本。这些样本用于估计模型的泛化性能。predicted.oob包含了对每个袋外样本的预测值,这些值可以用于评估模型在未见过的数据上的表现。在实际操作中如果bootstrap为"none",则只有predicted结果,若为"by.root"(默认值),则有predictedpredicted.oob。

3、如何绘制随机生存森林的DCA曲线?

复制代码
library(riskRegression)
library(dcurves)
`1 year`<-predictRisk(rf.grow,newdata=ss,time=12)#rf.grow为建立的随机生存森林模型
ss$`1 year`<-`1 year`
d<-dcurves::dca(Surv(Survival_months, OS) ~ `1 year`,
             data = ss,
             time = 12 # 时间选1年
)%>% dcurves::as_tibble()
library(ggplot2)
ggplot(d, aes(x=threshold, y=net_benefit,color=variable))+
  stat_smooth(method = "loess", se = FALSE, formula = "y ~ x", span = 0.2) +
  coord_cartesian(ylim = c(-0.01, 0.6)) +
  scale_x_continuous(labels = scales::label_percent(accuracy = 1)) +
  labs(x = "Threshold Probability", y = "Net Benefit", color = "") +
  theme_bw()
相关推荐
lihihi2 小时前
P1650 [ICPC 2004 Shanghai R] 田忌赛马(同洛谷2587)
开发语言·算法·r语言
进击的小头2 小时前
第3篇:最优控制理论数学基础——矩阵与向量的导数
python·线性代数·机器学习·矩阵
南滑散修2 小时前
机器学习(一)-数学基础
人工智能·机器学习
prince_zxill2 小时前
Raspberry Pi边缘AI:运行轻量级机器学习模型
人工智能·机器学习
放下华子我只抽RuiKe52 小时前
机器学习全景指南-基石篇——预测连续值的线性回归
人工智能·深度学习·神经网络·算法·机器学习·自然语言处理·线性回归
phoenix@Capricornus2 小时前
随机变量的方差
机器学习·概率论
逻辑君3 小时前
果蝇大脑被上传驱动虚拟身体-初探类脑计算
人工智能·神经网络·机器学习
星爷AG I3 小时前
14-5 运动控制的生态学理论(AGI基础理论)
人工智能·机器学习·agi
Takoony3 小时前
OpenClaw 深度拆解:下一代自主智能体架构全面解析
人工智能·深度学习·算法·机器学习·架构·openclaw
智算菩萨3 小时前
Chain-of-Thought Prompting:为什么逐步推理能提升大模型准确率
人工智能·深度学习·机器学习·语言模型·强化学习