R语言实现随机生存森林(3)

常见问题解答

1、计算C指数

1-Error rate,或者

复制代码
rsf.err <- get.cindex(yvar$Survival_months,yvar$OS,predicted=rf.grow$predicted)

2、模型中predicted和predicted.oob区别

predictedpredicted.oob是两个不同的属性,它们分别表示模型的预测结果和袋外(out-of-bag)预测结果。predicted是指通过随机森林模型对训练数据的预测结果。当你使用模型来对训练数据进行预测时,predicted会给出每个样本的预测值。predicted.oob是指模型对袋外(out-of-bag)样本的预测结果。袋外样本是在随机森林的构建中没有被用于训练的样本。这些样本用于估计模型的泛化性能。predicted.oob包含了对每个袋外样本的预测值,这些值可以用于评估模型在未见过的数据上的表现。在实际操作中如果bootstrap为"none",则只有predicted结果,若为"by.root"(默认值),则有predictedpredicted.oob。

3、如何绘制随机生存森林的DCA曲线?

复制代码
library(riskRegression)
library(dcurves)
`1 year`<-predictRisk(rf.grow,newdata=ss,time=12)#rf.grow为建立的随机生存森林模型
ss$`1 year`<-`1 year`
d<-dcurves::dca(Surv(Survival_months, OS) ~ `1 year`,
             data = ss,
             time = 12 # 时间选1年
)%>% dcurves::as_tibble()
library(ggplot2)
ggplot(d, aes(x=threshold, y=net_benefit,color=variable))+
  stat_smooth(method = "loess", se = FALSE, formula = "y ~ x", span = 0.2) +
  coord_cartesian(ylim = c(-0.01, 0.6)) +
  scale_x_continuous(labels = scales::label_percent(accuracy = 1)) +
  labs(x = "Threshold Probability", y = "Net Benefit", color = "") +
  theme_bw()
相关推荐
code bean21 小时前
【Langchain】 ChatPromptTemplate:从“手动拼字符串“到“专业模板“的进化之路
人工智能·机器学习·langchain
fl1768311 天前
智慧医疗胆囊病理识异常胆管狭窄检测数据集VOC+YOLO格式1210张3类别
人工智能·yolo·机器学习
Captain_Data1 天前
Python机器学习实战:用Scikit-learn从0构建信用风险评分模型(含WOE编码+AUC/KS/PSI评估+评分卡转换)
python·机器学习·数据分析·scikit-learn·风控建模
知识分享小能手1 天前
R语言入门学习教程,从入门到精通,R语言数据处理与清洗 (9)
开发语言·学习·r语言
AI科技星1 天前
数理原本·卷六:观测者本源
人工智能·线性代数·机器学习·量子计算·agi
deepdata_cn1 天前
少样本学习(Few-shot Learning)
机器学习·标注样本
好好学仿真1 天前
【故障诊断】DSCNN-HA-TL:融合Swin窗口注意力和全局注意力机制的变工况轴承故障诊断(迁移学习/小样本)
机器学习·信号处理·迁移学习·swintransformer·轴承故障诊断·深度可分离卷积·gam注意力
沪漂阿龙1 天前
AI大模型面试题:数据处理与特征工程详解——特征工程、缺失值、标准化、归一化、特征选择、数据不平衡、数据泄漏一次讲透
人工智能·机器学习
MediaTea1 天前
人工智能通识课:机器学习之强化学习
人工智能·机器学习
曦月逸霜1 天前
啥是RAG 它能干什么?
人工智能·python·机器学习