R语言实现随机生存森林(3)

常见问题解答

1、计算C指数

1-Error rate,或者

复制代码
rsf.err <- get.cindex(yvar$Survival_months,yvar$OS,predicted=rf.grow$predicted)

2、模型中predicted和predicted.oob区别

predictedpredicted.oob是两个不同的属性,它们分别表示模型的预测结果和袋外(out-of-bag)预测结果。predicted是指通过随机森林模型对训练数据的预测结果。当你使用模型来对训练数据进行预测时,predicted会给出每个样本的预测值。predicted.oob是指模型对袋外(out-of-bag)样本的预测结果。袋外样本是在随机森林的构建中没有被用于训练的样本。这些样本用于估计模型的泛化性能。predicted.oob包含了对每个袋外样本的预测值,这些值可以用于评估模型在未见过的数据上的表现。在实际操作中如果bootstrap为"none",则只有predicted结果,若为"by.root"(默认值),则有predictedpredicted.oob。

3、如何绘制随机生存森林的DCA曲线?

复制代码
library(riskRegression)
library(dcurves)
`1 year`<-predictRisk(rf.grow,newdata=ss,time=12)#rf.grow为建立的随机生存森林模型
ss$`1 year`<-`1 year`
d<-dcurves::dca(Surv(Survival_months, OS) ~ `1 year`,
             data = ss,
             time = 12 # 时间选1年
)%>% dcurves::as_tibble()
library(ggplot2)
ggplot(d, aes(x=threshold, y=net_benefit,color=variable))+
  stat_smooth(method = "loess", se = FALSE, formula = "y ~ x", span = 0.2) +
  coord_cartesian(ylim = c(-0.01, 0.6)) +
  scale_x_continuous(labels = scales::label_percent(accuracy = 1)) +
  labs(x = "Threshold Probability", y = "Net Benefit", color = "") +
  theme_bw()
相关推荐
AI_56785 小时前
AWS EC2新手入门:6步带你从零启动实例
大数据·数据库·人工智能·机器学习·aws
小鸡吃米…8 小时前
机器学习的商业化变现
人工智能·机器学习
木非哲11 小时前
机器学习--随机森林--从一棵树的直觉到一片林的哲学
人工智能·随机森林·机器学习
A尘埃12 小时前
保险公司车险理赔欺诈检测(随机森林)
算法·随机森林·机器学习
小瑞瑞acd16 小时前
【小瑞瑞精讲】卷积神经网络(CNN):从入门到精通,计算机如何“看”懂世界?
人工智能·python·深度学习·神经网络·机器学习
民乐团扒谱机17 小时前
【微实验】机器学习之集成学习 GBDT和XGBoost 附 matlab仿真代码 复制即可运行
人工智能·机器学习·matlab·集成学习·xgboost·gbdt·梯度提升树
Liue6123123117 小时前
自卸车多部件识别 _ Mask R-CNN改进模型实现(Caffe+FPN)_1
r语言·cnn·caffe
Σίσυφος190017 小时前
PCL法向量估计 之 RANSAC 平面估计法向量
算法·机器学习·平面
rcc862818 小时前
AI应用核心技能:从入门到精通的实战指南
人工智能·机器学习
霖大侠18 小时前
【无标题】
人工智能·深度学习·机器学习